【问答互动+全新音频资料下载】便携式音频与智能语音识别

【问答互动+全新音频资料下载】便携式音频与智能语音识别

  • 进士6342分

    2017 年的 CES ASIA 充满了浓浓的科技范儿,智能热度有增无减,有线产品层出不穷,你 Get 到潮流了吗?凭借在音频领域 30 多年的丰富经验,TI 的音频产品足以满足您最挑剔的耳朵!

    在寻找最新版的音频设计资料?2017 年新版资料在这里! 

    1. TI 音频产品概述及蓝牙音箱、耳机适配器应用选型及方案
    2. TI 针对条形音箱设计选型及应用方案
    3. TI 针对音频系统电源选型及应用方案
    4. TI 针对语音信号前处理的优化和拾音方案

    与此同时,由行业专家整理的常见技术问答也新鲜出炉啦!

    党庆昆

    TI 高级模拟应用工程师

    14年行业从业经验,专注音频产品与系统设计,TI高级模拟应用工程师,为您解析音频芯片领域的新技术和最热门的音频解决方案。


    在开始回答网友们的问题之前,我先总结一下两个经常被提及的问题:
    1)选择方案应该重点关注哪些指标?
    2)目前主流的蓝牙音箱使用方案有哪些?
    一、关注哪些指标?
    简单讲,因为蓝牙音箱都比较小,所以要求没有很高,需要注意的都是最基本的音频指标,比如功率,效率,频响和失真度。
    其他方面就是电池的播放时长和充电速度。到终端客户,往往需要用更形象的指标来描述,比如适用于多大空间,或者多远距离可以听。其他的效果主要在主观评介。很少有产品把自己的客观指标作为宣传点来告知终端用户。所以市场上很低端的低价蓝牙音箱则只关心功率。这种音箱通俗来讲就是“听个响”。影响到听音体验和使用体验的指标一般都没有测量。
    而追求品质的产品,都对影响声音和电池使用时长的基本指标做设计保证和质量管控。另外,指标也是相对静态的数字,因为测试信号是相对稳定的,而音乐和音频是复杂变化和大动态的,所以同样的指标,并不意味着有同样的主观表现。只能说,客观指标是基础。这些指标有时候是相互制约的,所以一般要根据自己需要的产品的特点,选择合适的芯片和设计。

    二、主流蓝牙音箱方案有哪些?

    主流蓝牙音箱的方案来说,一般蓝牙音箱的功率都小于10W, 一般是3~6W之间。

    小功率的单声道蓝牙音箱,主要使用LM48511, 自带升压部分,4欧姆喇叭的话可以到5.4W 1% THD+n. 因为是H类的功放(就是功放的升压电压会随着输入信号而调整),所以效率很高。

    中、大功率的,比如5W到10W的蓝牙音箱,单声道或者双声道,一般用TPA3130D2, TPA3118D2, TPA3128D2做功放,而DAC和处理一般用PCM5121PCM5101或者TLV320AIC3254PCM5121TLV320AIC3254都是内部有miniDSP, 可以做一些声音处理,包括基本的EQ等。

    这几个功放的性能都很好,因为是闭环反馈的,TPA3130D2是QFN封装的体积比较小,TPA3128是混合输出模式的的,静态电流很小,有助于提高系统效率。TPA3130D2是15W每声道的双声道功放,TPA3118D2/TPA3128D2是30W每声道的双声道功放,所以内阻都很小。

    数字输入的功放也用的非常广泛,而且有更高级的音频处理。

    普通声音处理的数字输入功放,一般来说,都具有多段EQ (5 bands to 10 bands)和1到3段DRC (按照频率分段),失真度控制等功能。蓝牙音箱用的比较多的比如TAS5711, 支持2.1输出组合,TAS5709/TAS5715这样的,支持2段DRC等等。

    还有一些数字输入功放具有更强大的声音处理功能,内置了 miniDSP和RAM/ROM, 比如TAS5756M/TAS5754M, 我们提供了一些预先做好的处理流程可以选择使用,比如多达10段的EQ,增强功能的多段DRC,低音增强,自适应EQ等。而更先进的声音处理,则是“智能 功放”,比如TAS5766M/TAS5782M/TAS2557M,这种算法对喇叭进行建模,播放音乐的时候,实时预测喇叭的状态,对震动幅度和温度进行实时 的控制,避免喇叭损坏,在这个基础上面,喇叭的瞬时功率可以轻松达到额定功率的3倍以上,喇叭的功率越大短时间峰值可以达到的功率越大,这样就可以实现传 统算法无法实现的很好的低音效果和更高的响度,弥补小口径喇叭以及小音腔的不足。

    另外我们还新推出了一些性比更高的数字输入功放比如TAS5733LTAS5753MD,有15段EQ和3段AGL,后续更会推出不需要输出电感的产品。

    这里的EQ实际上是BiQuad滤波器,就是不仅能做EQ,也可以做高通,低通,Notch, Bass/Treble shelf 等滤波器。

    软件工具上走向高度统一,就是熟悉了一个功放的使用,就可以很快的上手其他功放的使用和调试。便于快速产品化缩短开发时间,在及时使用新产品新技术的同事减少出错的机会。

    ===================================华丽的分割线===================================

    1. 问:在双节蓝牙音箱中实现充电五分钟,听歌两小时,最少需要多大的充电电流?(设定蓝牙音箱的电池是2200mA/7.4V)

    答:蓝牙音箱的电池容量通常是7.4V*2200mA·h=16280mW·h。以10W蓝牙音箱为例,其平均功率为1.5W左右,其播放时间 T=16280mW·h/1.5W=10H。

    因此,两小时的音乐播放的功耗为 W=1.5W*2H=3W·h。因此,需要在5分钟内充入3Wh的能量,因此其充电功率应该为 P=3W·h / (5/60 h)=36W。因此充电电流应该设置为 I=36W/7.4V=4.86A。TI 的充电IC,BQ24617/BQ25703A同步的控制器可满足此需求。

    2. 问:音响发烧友追求的“发烧运放”到底好在哪?就我所了解的,从运放的专业角度看运放的技术指标,那些被认为非常好的运放的指标并没有现在的一些优秀的音频运放的指标那么好。究竟这些“发烧运放”是真好吗?还是被市场炒起来的呢?

    答:其实有一个非常重要的问题是,主观性。人比较喜欢自己常听的声音,特别是在差距不大的时候。所以在客观指标到达一定的程度之后,往往需要对比。另外客观指标来讲,指标的测量是相对静态的,比如固定的幅度或者固定的频率的测试信号。和音乐的动态是有差异的。谐波成分的差异和非常微小的低噪会造成主观听感较大的差别。谐波和电路结构和制程相关。另外也与供电和外围电路设计关系很大。TI也有很多新的非常好的音频运放,比如OPA728

    3. 问:可否推荐一下音频的消噪方案?

    答:对常驻噪声,比如风声\马路噪声等可以用TLV320AIC3254/TLV320AIC3256/TLV320AIC3262这样的内置DSP的codec来处理。ANC现在官方不支持。

    4. 问:为什么现在很多智能产品的信号传输都采用2.4GHz的模块芯片呢?它的优势是什么?没有其他的频段可以发代替吗?

    答:民用free band,便于实现,成本低,5G是当前开始广泛使用的另一个频段。

    5. 问:蓝牙音箱设计中,如何选择合适的充电芯片和DC芯片,避免PA过流掉电保护?

    答:你说的这种,主要因为电源承载能力不够或者瞬态不够造成的,所以在设计的时候设计足够多的余量。另外使用功放的PLIMIT功能。

    6. 问:现在很多音响都是追求体积更小,音质更好,在这方面有什么好的设计和推荐?采用TI的那款芯片可以提高音质和稳定性呢?

    答:主打推荐TAS5782M, TAS2557

    7. 问:智能音响、电视等智能应用的语音识别需要外加几个codec?codec型号是?需要用几路MIC?

    答:2到4片TLV320ADC3101。一般是4到8路MIC。

    8. 问:TAS5782M对喇叭有什么要求?

    答:如果用智能算法的话,一般是3欧姆到8欧姆,功率1W以上。

    9. 问:TI是否有成熟的用于智能音响的语音识别的多MIC语音采集和前置处理方案?

    答:推荐采用TLV320ADC3101或者PCM1864, 消噪和阵列算法用DA10xx芯片。

    10. 问:无线耳机采用的哪款放大器?续航能力如何?

    答:推荐采用TPA6141A2, 从效率来讲,属于很高的水平,续航能力主要取决于电池大小和耳机。

    11. 问:无线耳机在电池管理方面采用了哪些方案?

    答:推荐采用BQ21040, BQ24040

    12. 目前TI的20W左右的两进一出的功放哪款比较常用?

    答:推荐使用TPA3136D2

    13. 问:如果Soundbar和移动电源功能结合,TI 有类似的方案吗?

    答:其实直接用的整体方案,TI还比较少,但是可以组合起来用的。一般蓝牙音箱和移动电源结合。Soundbar因为体积大,不便于携带。要想更好的蓝牙音箱效果,可以用TAS5782M这种有特殊算法的芯片。

    14. 问:Soundbar支持几种输入?

    答: 一般来说HDMI,蓝牙,光纤,同轴,模拟,3.5mm模拟,这六种,有的支持USB播放。

    15. 问:TPA3136D2对于开关频率是如何设置的?闭环反馈如何设计?

    答:50k,所以一般不必考虑调整频率,不易干扰am。本身芯片就是闭环反馈,如果想要滤波器后反馈,可以改为LC滤波然后增加反馈,一般没有必要。

    16. 问:如何优化无线传输音频信号的音质呢?

    答:传输软件什么往往改的余地不大,都是芯片厂商提供的,所以你能做的,可能就是优化天线设计,减少噪声,提高灵敏度。另外也要看功放部分的音质,确定是哪部分产生的噪声多。

    17. 问:总是听说蓝牙音响音质不是特别好,是蓝牙通信的速率限制、编码解码的原因,还是后面DA的输出和功率放大器的设计有些问题呢?

    答:主要是国内比较流行低端产品造成的。从头到尾都要节省成本所以都会有点问题,音质就没办法做好。就是便宜。有些品牌的做的要好一些但是品牌溢价又比较多。

    18. 问:利用蓝牙传输的时候如何确保信号不中断,提高稳定性。蓝牙传输距离一般是10米左右?

    答:是10米左右,5.0之后会更好,一般软件没问题的话主要是硬件提高灵敏度。

    19. 问:Soundbar 内置无线发射器 能做到多远?

    答:一般是20米以内,因为是2.4G的,在有人遮挡的时候还要重传。

    20. 问:在进行语音识别时,是否必须要联网,能否可以使用离线数据,TI的方案有没有较好方案?

    答:需要联网。TI方案的优点是,提供了一定的本地化的语音识别,所以有些命令不必联网,所以在不能联网的时候也能完成一些基本操作。

  • 秀才280分

    给大家推荐几款比较好的参考设计和产品,希望有所帮助。


    热门参考设计:适用智能语音识别、蓝牙音响、Soundbar、无线耳机、低音炮、家庭影院等。
     
    参考设计 设计指南 原理图 Gerber 文件
    采用 66AK2G02 的用于语音应用的声音预处理系统参考设计(语音识别新发布,支持特殊功能如杜比开发)
    采用 C5517 的用于语音应用的声音预处理系统参考设计(语音识别新发布!)
    具有数字输入和处理功能的高保真 175W D 类音频放大器参考设计
    采用 TPS61088 的音频放大器的包络跟踪电源参考设计
    WiLink 8 Wi-Fi/蓝牙/Bluetooth Smart Audio Multiroom Cape 参考设计
    无线超低音放大器参考设计
    用于便携和智能手机应用的高保真音频耳机回放
    针对电流输出音频 DAC 的高保真耳机放大器参考设计
     
    热门产品:
    应用领域 器件 说明 数据表 立即订购
    蓝牙音箱 TPA3136 10W 超低 EMI 无电感立体声 (BTL) D 类音频放大器(高性价比!)
    TPA3128 采用 SpeakerGuard™ 的 30W 立体声 (BTL) D 类音频放大器
    TPS61178 具备负载断开功能的 20V 全集成同步升压(新发布!)
    拉杆音响、KTV TAS5751 采用 EQ 和 AGL 的数字音频功率放大器
    TAS5754 具有混合 RAM/ROM 处理器的数字输入、闭环 D 类放大器
    低音炮 TAS5782 采用 96kHz 架构的数字输入闭环 D 类放大器评估模块
    TAS5711 具有扬声器均衡、DRC 和 2.1 支持的 20W 立体声 I2S 音频放大器
    麦克风 TLV320ADC3101 92dB SNR 低功耗立体声 ADC,支持数字麦克风和 miniDSP
    便携式播放器 TLV320AIC3254 采用可编程 miniDSP 的超低功耗立体声音频编解码器
    家庭影院、电视、语音识别音箱 PCM1864 具有智能前端的 SW 控制、4 通道音频 ADC


  • 秀才50分

    现在爬山旅游(那种野外爬山)带个随身小音箱越来越多,听下歌缓解疲劳。带蓝牙语音的就很放方便,人机互动很舒适。我们公司也正在开发试水两款。硬件开发没有过多问题,在软件是有些小问题。蓝牙技术和语音识别的结合目前都是将语音识别模块放在AG上,然后让用户对HF发出语音指令,随后HF再进行录音并且对录音进行压缩编码处理,编码后的音频通过蓝牙通信协议发送到AG端,在AG端对音频进行解码恢复,再将恢复后的语音送入语音识别模块进行识别,然而现有的音频编码方式多为有损压缩,在编码再解码后,语音质量会有变化,影响识别效果。现在正在就这方面问题进行改进,以达到更好的使用效果。准备参考TI的一些专用芯片试试改进。

    tps562200&tps563200电源芯片纹波为什么那么大,怎么改也改不好

  • 秀才20分

    我曾经也做一个简单的语音识别播放系统,同时还有物联网WIFI插座控制功能,基于关键词识别的,但是有中文SDK,简单开发很方便。

    不知道TI的方案,是不是也是基于关键词识别的?

    SDK开发是否方便?

    播放的语音是否支持板载Flash,最大支持多大的Flash,是否支持TF/SD扩展?

    能否实现固件的OTA升级?

  • 秀才110分

    关于蓝牙音箱蓝牙耳机我就有问题了,这两个我都有,还不止一个。。主要是蓝牙耳机,我带在耳朵上,手机就放在口袋,这才几米啊,骑自行车的时候就会出现,有时候站着,蓝牙就会卡顿,自行车骑行过程中又不会,按道理来说,路上能有什么干扰,只要是停下了等红灯,口袋稍微低了点,就会卡顿,然后腿跳起来,没事。。但是走路的时候又没有。。还有关于语音识别的,我真的很好奇,比如我说一个地名,汉字这么多同音字,为啥他就能识别出我想说的地名,奇怪了,你要是出现几个相同声音的字我还可以理解,但是每次好像都是对的,我普通话也没这么标准啊。。

  • 秀才240分

    个人认为语音识别技术在未来会有广泛的应用,尤其是远场语音识别技术和针对单个声音的特定语音识别技术,其好处是结合无线网络传输技术如低功耗蓝牙、WiFi等,可以实现用户通过语音控制家里的智能设备,实现智能应用。

    核心处理器可以采用有线供电技术,做为组网的核心连接端子,其他小的语音收集装置可独立放置在放假的任何区域,做为语音收集和有效去燥的子设备,有必要采用低功耗技术。让整个语音识别形成单空间内的语音场,判别用户的使用。

  • 举人1830分

    随着科学技术的发展,人类正在变得越来越'懒惰',键盘的出现,使人类甩掉了纸笔。语音识别技术也迟早会使人类,将能动嘴不动手的天性发挥得淋漓尽致。

  • 秀才210分

    这个想法很好,集成了音频输入与输出,输出可以是标准普通话,没有问题,但是语音输入需要考虑各个地方的口音等问题,并不一定都是标准普通话。

  • 秀才120分

    语音识别的最大困难在于声学

        为什么会说语音识别最大的落地还是在场景之中,因为这涉及了语音交互用户场景的变化,当用户从手机切换到类似Echo智能音箱或者机器人的时候,实际上麦克风面临的环境就完全变了,这就如同两个人窃窃私语和大声嘶喊的区别。
        前几年,语音交互应用最为普遍的就是以Siri为代表的智能手机,再到这两年的微软小娜和小冰等等...这个场景一般都是采用单麦克风系统。单麦克风系统可以在低噪声、无混响、距离声源很近的情况下获得符合语音识别需求的声音信号。但是,若声源距离麦克风距离较远,并且真实环境存在大量的噪声、多径反射和混响,导致拾取信号的质量下降,这会严重影响语音识别率。而且,单麦克风接收的信号,是由多个声源和环境噪声叠加的,很难实现各个声源的分离。这样就无法实现声源定位和分离,这很重要,因为还有一类声音的叠加并非噪声,但是在语音识别中也要抑制,就是人声的干扰,语音识别显然不能同时识别两个以上的声音。
        显然,当语音交互的场景过渡到以Echo、机器人或者汽车为主要场景的时候,单麦克风的局限就凸显出来。为了解决单麦克风的这些局限性,利用麦克风阵列进行语音处理的方法应时而生。麦克风阵列由一组按一定几何结构(常用线形、环形)摆放的麦克风组成,对采集的不同空间方向的声音信号进行空时处理,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等功能,进而提高语音信号处理质量,以提高真实环境下的语音识别率。
    但是仅靠麦克风阵列提供的这些技术还是不够的,这只能解决部分远场化的问题。事实上,真实场景下我们需要更复杂的识别技术,能不能不依赖于云端?能不能同时追踪和识别多个人讲话?能不能识别语调和情感?等等这些环节,都是急需要解决的问题?而很多技术的瓶颈就在于声学能否也有一个较大的突破。


  • 秀才305分

    TI的智能语音识别方案是否支持麦克风阵列?最多能支持几个?TI有没有麦克风阵列的相关资料

  • 秀才80分

    今天看了百度AI 开发者大会,会上推出了一款智能语音系统 duer OS,个人觉得duer OS将在中国智能音响行业占很大的比重

    主要是该系统的智能语音识别能考虑之前的对话,识别处所针对的话题,或者对象是什么,不像siri那么古板,只会识别当前的问题。

    而且duer OS还有唤醒功能,我们只要给我们的智能设备设置一个唤醒关键字,我们连开机键都不要按了。

    duer OS提过了大量的api,开发方便,我都想搞个开发版玩玩

  • 秀才322分

    不管是音响还是蓝牙耳机方案,音质是一个很重要的指标,续航能力也是非常重要的,在户外,现在的电池能工作两三小时已经不错了,就是有移动电源,也就五六小时,能够保证10小时续航很难,就需要音响方案的功耗设计。

  • 秀才60分

    先学习了解一下,因为以后的项目有可能用到音频,目前还没有用过音频。初步估计其他功能没有特殊要求,但是有两点要求。一、稳定性必须好,因为是医疗行业;二、支持多语言,因为仪器要进行出口。

  • 状元51066分

    可以。

    麦克风阵列:

    http://www.ti.com.cn/tool/cn/tida-01454

    http://processors.wiki.ti.com/index.php/Main_Page

    Think Over Before Asking.

    http://www.catb.org/~esr/faqs/smart-questions.html#goal

  • 举人730分

    开一下脑洞!语言识别可以作为安全密码防护吗?如果可以,如何做到更安全加密,更简单便捷!