中国电子技术网

设为首页 网站地图 加入收藏

 
 
  • 首页 > 新闻 > 语音和机器视觉技术并驾齐驱,极限元深耕三大行业

语音和机器视觉技术并驾齐驱,极限元深耕三大行业

关键词:机器视觉技术 人工智能技术 智能交互式语音技术

时间:2017-06-06 10:20:13       来源:互联网

在语音领域,国内除了科大讯飞独占鳌头外,思必驰和云知声等创业公司处于行业领先的位置,极限元智能科技创始人雷臻认为他们在技术与之处于同一梯队,只是在行业应用方面有所差异。极限元以语音技术起步,但不仅限于此。为了给客户提供一站式解决方案,他们又涉足机器视觉。目前,他们在泛娱乐等三大行业进行着深度挖掘。

  此次,雷锋网新智造采访了雷臻,本文主要讲述了极限元的业务板块、发展状况以及雷臻的创业经历。

  “我们的业务主要还是ToB,ToC我们在做一些尝试,但是现在还没有。ToB客单价很高,忠诚度高;ToC客单价相对比较低,忠诚度低,这是两种完全不同的思路。你用一个团队去做两个的话,很容易把力量分散了。”极限元智能科技CEO雷臻一开始告诉雷锋网新智造他们的业务模式,这周他在外出差,也主要与几家B端企业谈合作项目。

  语音和机器视觉技术并驾齐驱,极限元深耕三大行业

blob.png
  极限元智能科技创始人雷臻

  极限元成立于2014年8月,致力于发展人工智能技术,主要为行业用户提供智能交互式语音技术和机器视觉等整体解决方案。不过,极限元团队刚成立时是以语音技术起步的,包括团队技术合伙人康利强等人在语音行业都有诸多积累。他们的语音技术主要包括语音识别、语音合成、声纹识别和语音检索等,雷臻认为,在语音行业,他们是为数不多具有完整语音产业技术的人工智能公司。与同行业里的云知声和思必驰等公司相比,“至少在技术方面我们处在同一梯队”。

  极限元与这些公司的不同之处主要是在行业应用上,雷臻介绍说,极限元目前专注在智能安全、智能教育和泛娱乐这三大领域做深度挖掘。

  在智能安全领域,极限元已跟国家网信办和公安部门进行合作,通过语音技术识别政治言论、暴力、恐怖和诈骗等有害信息。比如在诈骗电话中,声音的特征和规则都是固定的,通过极限元的语音检索技术,就可以判断电话通话的声音是否为诈骗音。

  在智能教育方面,极限元主要提供语音测评服务,包括中小学生的古诗词诵读测评和英语测评,能够将学生的发音和韵律通过与标准音比对,来帮助其提升发音准确度。目前,极限元跟语文出版社合作研发了两款APP,其前台交互和后台技术都由极限元提供。

 泛娱乐行业是极限元从去年年底才开始布局的,他们主要利用语音识别技术来达到交互目的。比如在直播中,主播说一些特定关键词命令,通过语音识别就可以产生一些交互效果,从而增强娱乐性和用户黏性。不过,由于泛娱乐对交互性要求比较高,极限元也使用了机器视觉技术,以此识别主播的“特定手势(心型和抱拳等)”,在后台产生动画特效。由于两种技术的支撑,这样他们就提供了一个具有竞争力的解决方案,直播平台、经纪公司和网红主播都可以使用。雷臻表示他们在这一行业的进展不错,“最近要签几个单”。

  泛娱乐领域的鉴黄市场竞争则十分激烈,包括阿里绿网和腾讯万象优图等人工智能团队都已占据了大量市场份额,极限元也加入了这片红海的争夺战中。鉴黄主要涉及到图像识别、语音识别和文本挖掘等技术,雷臻表示虽然在技术层面上各个团队相差无几,但市场讲求“先入为主”。即便如此,他认为这些团队只是抢先占据了一些市场,而极限元在服务等方面也都不差,他们还有机会分一杯羹。

  除了在泛娱乐等行业的应用外,极限元还有三维虚拟听觉设备、互联网有害音视频监测系统和车载疲劳驾驶检测仪等产品推出。在车载疲劳驾驶方面,极限元通过采用人脸、姿态和语言等多项人体特征作为判断标准,基于大量数据训练,对疲劳驾驶场景进行监测。“我们通过摄像头检测你的面部,通过面部状态和我们的模型进行对比,然后分析你是处在疲劳状态还是正常状态,如果处在疲劳的状态机器就会提醒你。”雷臻说道。

  实际上,这些行业应用都需要用到机器视觉技术,雷臻表示现阶段极限元为客户做基于闭环的解决方案,所以他们在机器视觉和语音识别技术上的投入度一致。另一方面,语音技术和机器视觉技术在算法等方面有诸多相似的地方,视觉部分做起来也比较顺手。

  当问及是否会向医疗和家居等其他领域扩张时,他表示极限元暂时还没有这种打算。

  “创业公司最怕的就是扩张太快,人力资源和资金都是有限的。现在所涉及的三大领域都是朝阳产业,而且每一个领域深耕下去,都是百亿的市场。但你铺的太开就变成哪个点都不精,这是没有太大意义的。我们是先把这些领域做好,包括数据和人才积累足够了之后,可能才会去考虑其它领域。”

  同时,他说这些领域暂不触及也是因为有很多“坑”,“看起来很美好,但是真正做的话就不一定了”。

  跟同行业的竞争者相比,雷臻认为,技术门槛本身是一方面,更重要的是他们愿意在这三大领域扎根进去,并积累了数据和人才,加深了对整个业务流程的理解,“至少在在泛娱乐方面比他们强太多了”。他进一步解释说,在这些领域,其他公司大都只是提供一个技术方案,提供一个基本功能,极限元则提供针对端到端的解决方案。他用沃尔玛的竞争力举例:当别人逛完了一个商场,还会再逛另外一个商场。但沃尔玛就是一站式购物,我有那么多不错的解决方案,你根据情况进行选择,我们可以根据你的业务做一些深度定制。

  对于极限元目前的发展,雷臻表示团队愈加成熟,公司发展状态趋好。去年,他们实现了盈亏平衡,营收达上千万级,符合公司发展的基本目标,但他们还有挑战目标,以团队的实力,他认为应该能做得更好。在未来一到三年,他希望公司能在三大业务板块中成为最一流的人工智能解决方案提供方。

  据了解,极限元团队目前50多人,今年预计会增加到70人。B端合作方包括360、搜狗和腾讯等企业共四五十家。极限元已于去年完成了天使轮4000万融资,新一轮融资他们希望能接洽一些在业务方面有资源的基金。

  此外,雷锋网新智造了解到,雷臻还是全球最大的比特币交易平台OKCoin的联合创始人。OKCoin创立于2013年6月,目前有近300人,7*24小时为用户提供服务,办公区域与极限元智能科技仅一墙之隔。

  进入比特币这个异常火爆的市场不久,他随即就成立了极限元,进军人工智能行业。就行业发展趋向而言,作为创业者,他的嗅觉变得异常敏锐。其次,区块链技术和人工智能技术本质上也有很多相似的地方,而且基于他和合伙人在人工智能多年的技术积累,这次创业就更是顺理成章。

  不过,他早前创业却历经坎坷,当初由于在创业方向和管理经验等各个方面存在不足,跟朋友做过的WAP社区“haodewap”和手机优惠券两个项目都以失败而告终,这是他最困难的一段时期。

  但经过这么多年创业的磨砺,也让他对创业本质的理解更加深刻,包括在找人、找钱、找资源和找方向上,所考虑的问题更加全面了。也有很多在思想意识上的积极变化,虽然不能用准确的语言表述,但这些都在潜移默化中重塑了他如今的心境。因为经历过失败的考验,抗压能力自然强于常人。即使现在也会面临困境,“一般来说,我都看的比较淡”,他说。

 

猜你喜欢

友荐云推荐