爱国者数码(国产数码相机品牌列表)
新视野消费群作品
作者|石林
编辑|鲈鱼
"市场和技术的匹配需要为破坏性技术找到一个新的利基市场."克莱顿·克里斯滕森曾在《创新者的困境》一书中写道 , 这一逻辑同样适用于录音笔行业 。
新眼注:小众市场是指在更大的细分市场中,由一小群兴趣或需求相似的客户所占据的市场空 。大多数成功的创业型企业最初并不是在大市场中开展业务,而是通过在更大的市场中识别新兴或未被发现的利基市场来发展业务 。
搜索录音笔词条 , 你会发现人们把录音笔分为三代,第一代是磁带录音笔 , 第二代是数字录音笔,第三代是智能录音笔,这也恰好对应了录音笔进化的三个阶段 。
录音机流行于1835-1998年,这一时期的代表播放器主要是飞利浦和索尼 。磁带录音过程大致如下:经过特殊处理后 , 声音被转换成可以磁化磁带上粉末颗粒的电信号 。当播放磁带时,磁粉颗粒发出相同的电信号,这些电信号被转换成声音 。大多数人不知道它在录音技术中的作用,但它是一个关键的突破 。
1999年到2018年流行数码录音笔,我们也很熟悉 。主要代表玩家还是飞利浦和索尼 。与传统的录音机相比,数字录音笔通过数字存储来记录音频 。为了方便操作和提高录音质量 , 笔的外形不仅简单 , 而且具有多种功能,如激光笔功能、FM调频、MP3播放等 。
2018年之后,经过AI语音技术的突破,录音笔的播放器格局和功能形态发生了变化,像我们熟悉的科大讯飞、搜狗这样的播放器走上了历史舞台(这里有个小细节 , 最早在录音方面的应用是按需要转录的录音时长收费 , 后来出现了可以终身免费转录的智能录音笔硬件) 。其中讯飞智能录音笔规格较多 , 至今已发布9款(SR101 , SR301
一个明显的感知是,每一次科技创新和消费升级的双轮驱动,都会产生颠覆性的创新机会 。进入移动互联网时代后,人工智能技术的发展给传统录音笔行业带来了创新机遇 。基于此,本文的新视野将着重拆解录音笔的前世今生 。
录音笔“编年史”机器被用来录音和播放声音已经有一百年了 。
1879年,“科学界的拿破仑”爱迪生把留声机带到了法国巴黎的万国博览会,这是人类历史上第一次用工具复制声音 。但在当时,留声机只是上流社会的宝物,未能普及到民用 。
1888年,科学家O·史密斯在一篇论文中提到“利用剩磁技术录音”,为录音机提供了理论基础 。早期的钢丝录音机和钢录音机开始出现 。此后半个多世纪,录音机技术没有取得突破,直到1935年,德国人制造出了录音机 。
随着电影、VCD、DVD的普及,声音和视觉得到了统一,音频+视频录制开始走向数字化 。如果视听回放是将音频文件展示给外界的主要方式,那么如何将音频文件导出为文字是另一个需要研究的问题 。
一般来说,录音只需要记录和存储现场产生的外界声音,对于产生的声源、语言、发音角色等没有太多方向性的选择,比如声源是谁、用什么语言、参与人员是谁、是否需要同步翻译等 。
2005年,深度学习技术出现,让这些需求成为可能 。深度学习就是用计算机模拟人工神经网络,让它逐渐“学习”各种任务 。经过训练的人工神经网络具有一定的人机交互能力,比如几种主要语言之间的翻译 。
之后的发展主线比较清晰,大致可以分为以下四个阶段:
一、技术提升阶段(2005-2009年) 。在此期间,人工智能主要利用人工神经网络的自学习功能、联想记忆功能和寻找最优解的能力来改造机器学习,但并没有实现规模化应用 。
其次,应用试点阶段(2009-2011年)主要实现了从理论和竞赛到软件产品落地和集成应用的过程 。例如,亚历克斯·格雷夫斯(Alex Graves)在2009年的ICDAR上赢得了三场连字识别比赛,苹果语音助手Siri被搭载在iPhone 4S上 。
2011年,Siri通过iPhone的交互界面识别用户的语音,然后对手机的操作做出自动响应,这标志着消费级智能终端首次搭载语音识别技术 。
再次,在应用落地阶段(2011-2016年),一方面各大智能终端厂商开始不同程度的整合语音助手;另一方面 , 录音笔的分段开始全面接入人工智能 。
两个具体案例是 , 2016年,科大讯飞提出了基于深度全序列卷积神经网络的语音识别框架,不仅大大提高了识别效果,还解决了解码延迟高的问题 。搜狗还推出了语音交互引擎“尹稚” , 旨在让人机交互更加自然 。
推荐阅读
- 古代嫔妃的丹青文字描述的
- 南方腊肠要晒多久才能吃,腊肠一般要晒多久
- 自己在家怎么练软功
- 种葵花籽的步骤
- 纸上谈兵概括 纸上谈兵概括内容
- 微商发朋友圈的句子
- 家庭检测硫磺小妙招
- 大肠高压锅压多久才熟,生猪大肠煮多长时间能熟
- 鸦胆子治疣全过程 鸦胆子治瘊子