济南诚一化工有限公司

  • 电话:15063337358
  • 传真:0531-85932887

离开 YY 三年,赵斌和他的声网是如何做实时音视频互动的?

作者:诺亚娱乐-诺亚娱乐登录-诺亚娱乐官网 发布时间:2019-08-30 11:21:45

  

  雷锋网(公众号:雷锋网)注:声网 Agora.io 创始人赵斌

  “为什么通话质量不好?”

  在从业生涯里,赵斌总会遇到别人问这样的问题,然后他只能告诉这只是由于网络或设备出了毛病。

  但这样的问题问的多了,会让他感到很沮丧,因为如果是网络的问题,程序员就不能拿出什么解决办法吗?确实没有,你能做的也不过是专注于改进软件和运用先进的算法。而且后来在 YY 的工作经验让他明白,玩家们没有时间会听你解释这只是一个网络问题,而非软件问题。

  但这个问题总要有人去解决,后来 YY 就开始通过新技术优化公共互联网,以此来提高音视频通话质量。也因此,仅在 2012 年,YY 就支持了 4000 亿分钟的语音通话。同时,这也让赵斌看到,实时通信技术或者在公共互联网上通讯的方向将会变得很有价值,它会被广泛应用在许多移动设备和垂直领域。

  2013 年年底,赵斌带着他的技术梦离开了 YY 语音,那时他已经在网络实时通讯领域耕耘了近 20 年。随后,他便去了硅谷创业,成为一家创业公司声网 Agora.io 的创始人。

  这与他之前的工作一脉相承,不同的是,他们不是做一个独立的产品,而是开放的语音生态,也就是把语音技术打包成 SDK,为全球开发者提供高质量的实时音视频和连麦互动直播服务。举例来说,如果你要做一款手机端的语音实时交流工具,那么在语音模块,不需要自己开发,直接嵌入声网的 SDK,就可以获得高质量的效果。雷锋网了解到,自 2015 年声网高清实时通话云服务正式上线以来,已逐步实现全平台支持使用。

  当然,创业三年来,声网给别人证明自己的最直接方式是给出一些数据。9 月 21 日,赵斌在第三届 RTC 2017 实时互联网大会上宣布,声网 SDK 目前已服务全球超过 10 万+开发者,触达终端数 10 亿+,日通话分钟数突破亿级。

  这些数字意味着什么?赵斌在媒体沟通会上对这些成绩进行了一番分析。

  相比于 2015 年,从开发者数量、SDK 终端覆盖量、通话分钟数来看,涨幅是数十倍的。服务的领域也从起初的企业协作、教育、呼叫中心、社交领域,扩张到直播、金融、医疗、电商等领域,以及 2017 年大热的社交游戏、AI 音箱等应用场景。

  在他看来,实时音视频互动正在成为各个领域创新的重点工具,全行业都需要全栈式 RTC 服务。雷锋网了解到,针对 RTC 独特的服务特性,声网正在构建一套全球服务支撑体系,不仅能实现全球范围 7*24 技术支持,还能为开发者提供专家级咨询服务。从集成、测试、灰度、上线到售后维护,“全程护航”,并通过专业分析工具最快速定位分析并解决问题。

  会上,声网高级产品总监 Edward Brakus 介绍说,目前的互联网服务基本是由不同 ISP(互联网服务提供商)提供,其中有做全球化服务、也有做局域化服务的。比如,电信是中国最大的 ISP, 而铁通、长城宽带是比较小的 ISP,这种多样化的服务商为整个互联网传输带来了视频通话时卡顿或者网络拥挤等复杂情况。

  当前标准互联网服务做实时音视频服务时主要面临三种问题:丢包、延时、低可用带宽,这也导致了上述电话语音模糊等状况,而声网则在传输层进行了优化。

  总体而言,声网相当于建了一个虚拟大网,连接了不同的 ISP,通过动态实时分析互联网实时传输状况,从而发现有效传输数据的最优路径。

  据其介绍,声网提供的服务在速度上优于一般的互联网传输,“在中国、欧洲、北美、南美的区域内传输,它最差的情况起码有 200 毫秒,但是我们来做可能就是 20 毫秒。区域间也一样,北美 、中国、欧洲之间的物理延时基本在 400、500 毫秒,但是接入我们服务传输在 100 毫秒以内 。”

  作为服务商,除了在速度、质量上提供好服务之外,开放的生态也非常重要。比如在语音识别和文字化上跟科大讯飞合作,与其他合作方在游戏领域做方案支持和服务。而在视频社交探索中,它需要有人脸识别、互动能力等补充功能,这就需要跟合作伙伴一起做解决方案。“如果没有开放性,就很难有繁荣和活跃的生态。而在这一点上还有建设的空间和发展途径。”赵斌说。

  为了做生态,声网自己联合了多家国内外厂商,发起了实时互联网生态圈 Agora Plus。该生态圈将专注于实时互联网领域,通过与 RTC 相关技术、产品和服务的深度整合,创新场景应用,为开发者提供最大化的价值。

  不过,由于实时互联网尚处在起步阶段,RTC 实时通信仍然是一个年轻的创新技术服务,这也就更需要各方进行合作。在声网联合创始人肖峰看来,RTC 会成为底层能力,因为它本身代表着声音、视频、实时沟通,应用普适性非常强。而通过与生态合作方技术的深度整合,声网也在过去一年中推出了针对游戏和泛娱乐行业的两个解决方案。

  虽然是被要求讲述过去一年声网的发展情况,但作为一个典型的技术型创始人,赵斌的话题不可避免的转移到了技术上。他认为,“深度技术最主要的是软件定义虚拟网,相当于我们有一个虚拟专网,去保证网络传输通讯的服务质量。当然也还有针对互联网设计的编码算法,如果没有这样的编码算法,当你在互联网上去做实时音视频的时候,它的质量不好是理所当然的。”而在未来,声网也会在技术持续做深度挖掘,与大数据、人工智能等前沿领域的结合或将更多新的可能性。

  终端地域全规模的覆盖上,他表示,“这实际上是覆盖能力的一个关键特征,也是任何一个做业务的创新者或者开发商在利用这个能力时必然要经过的考验,如果没有这种全覆盖的能力,业务就有很多局限,或者也会有很多风险。”

  在业务层面,赵斌曾表示,未来越来越多的移动 APP 会更多考虑添加交互或者实时互动功能,这种功能能够给应用本身带来更大的使用活跃度,增加它的使用粘性,从而提升用户留存。另一方面,社交类产品,例如约会类的社交需求,过去没有实时音视频交流功能,只是线上简单交流,线下见面,增加此功能后,会有助于平台提高用户满意度和社交效果。

  目前,许多行业通过实时音视频功能逐渐搬到了线上,比如,在人力资源的招聘面试种,见面的成本更高,而通过音视频沟通就能在很大程度解决这个问题。医疗、金融行业也将产生更多基于实时通信的服务场景,这些行业的市场潜力在他看来也很广阔。

  雷锋网原创文章,未经授权禁止转载。详情见转载须知。