采集大量的语音数据,通过精准的人工标注,与深度学习算法相结合,才能研发出更先进的声学和语言模型。
进而提升语析的语音识别准确率!
一般来说,获取语音数据通常有四种方式:第一,用户授权采集;第二,专业录音采集,以付费模式为主;
第三,免费公开的语音数据,涵盖多种语言、方言和不同的语音场景;第四,数据共享。
陈延森选择了第四种合作方式,在陶静文的牵线搭桥下,橙子科技与科大讯飞建立合作,橙子手机用户使用语音功能产生的数据,将由双方共享。
橙子科技节省了大量资金和时间,科大讯飞也能借机丰富自身的语音数据库。
“老板,已经搞定了,但大约有30%的语音数据,还没有经过人工标注,所以只能算是原始数据。”
周创曦干笑一声,连忙回答道。
入职仅两周,他早习惯了陈延森的称呼方式。
作为华科大少年班的高材生、uiuc电子工程学博士,他主要精通计算机视觉、图像处理和语音识别技术。
在他看来,陈延喊他老周,倒多了几分亲切感。
当初两人不过是通过视频面试的形式,短暂聊了半个小时,周创曦便下定决心,回国加入橙子科技,打造一款ai语音大模型软件。
“人事部正在帮你招数据标注员,下周微软的丹尼尔·波维也会入职,橙子科技的人工智能实验室就交给你们俩了,希望能早日看到产品上线。”
陈延森拍着周创曦的肩膀叮嘱道。
两人一个二十岁,另一个三十一岁,但周创曦这个uiuc电子工程学博士,在陈延森面前,表现得却像个谦卑的学生。
核心原因是:一方面,陈延森给的太多,月薪10万,外加橙子科技10万股期权,分四年拿完,中途若是做出成绩,还有额外的股权奖励,算下来年薪超400万。
另一方面,当他得知,语析的系统框架全由陈延森独立编写完成后,顿时震惊不已,在查看代码语言后,更是对新老板产生了崇拜之情。
他心里清楚,以陈延森的计算机编程水平,哪怕放在灯塔国,也是成为ai语音识别领域的超级大神。
因此,周创曦借着打工名义,抽空就找陈延森讨论语音模型的优化方向。
这段日子,倒让他想起了在uiuc求学的经历。
“danielpovey?”周创曦听到新同事的名字后,下意识地追问道。
“你知道他?”陈延森诧异道。
此时