云豹科技 > 行业动态 > 产品动态 > 直播app开发中增加用户留存率必不可少的技术之一

直播app开发中增加用户留存率必不可少的技术之一

发布来源：云豹科技

发布人：云豹科技

2019-02-13 09:17:07

在互联网高速发展的大背景下，如今已经是年轻人的时代和天下，无论是直播领域还是游戏领域，随处都可以看到00后的“足迹”。为了留住年轻的用户群体，在直播app开发过程中就需要不断地更新迭代，增加用户留存率。近几年来，实时音频的混音技术成为直播领域创新玩法的“常青树”，接下来就简单介绍一下相关的知识内容。

直播app源码

1. 什么是混音？

百度百科对于混音是这样解释的：混音常简称为mix，是音乐制作中的一个步骤，常常也会缩写成MIX。是把多种来源的声音，整合为一个立体音轨或单音音轨中。但是在直播类app开发过程中所提到的混音，可以理解成为是将两路或者多路的音频流混合在一起，形成一路音频流。

2. 混音的实现方式有几种？

混音的实现方式分为两种：终端混音和云端混音。

（1）终端混音通常应用于背景配音、音乐伴奏等场景。

（2）云端混音可以属于云端混流的一部分，利用云端的计算能力去做多路音视频流的音画对齐，或者是降低下行带宽成本。当然也可以做纯粹的云端混音，从而实现直播中连麦合唱等场景需求。

3. 直播app中哪些地方会用到混音？

混音技术在直播的应用场景中早已屡见不鲜，像是直播间内的掌声、笑声或者是背景音乐，这些都属于混音技术的应用。在这里举个简单的例子，在主播端采集主播的声音形成音频流，然后再从音频文件中读取音频流，把这两路音频流混合后，就会形成一路音频流，也就是我们在直播间内听到的那些声音。

直播软件源码

4.混音之间需要做哪些处理？

虽然说把两路音频流混合在一起形成一路音频流就是混音了，但是并不是任何的两路音频流都能够直接混合的，必须要符合以下条件才可以混合。

（1）格式：要想混合在一起，最重要的就是格式相同，并且解压成为PCM格式。

（2）帧长：帧长一般是由编码格式而决定的，而PCM没有帧长的概念，开发时可以根据需求自行决定帧长。在这里提醒大家一下，为了和主流音频编码格式的帧长保持一致，推荐采用20ms。

（3）采样率：需要转换成为相同的采样率。主流的采样率包括：16kHz、32kHz、44.1kHz和48kHz。

（4）声道数：必须是同样的单声道或者是双声道。

（5）位深/采样格式：即承载每个采样点数据的bit数目要保持一致。

通过以上五种条件，保持一致后两个音频流就可以混合了。但是在混音之前，还需要做噪音抑制、回声消除和静音检测等处理。而回声消除和噪音抑制是属于语音前处理范畴的工作，在编码之前，采集、语音前处理、混音之前的处理、混音之后的处理应该按照顺序进行。

直播软件源码

5.混音的基础算法需要考虑什么因素？

在混音算法中，音频采样的数据表征声音的振幅，音频数据的叠加也呈线性，所以在这里需要考虑两个方面的因素。

（1）两个音频流对应采样点数据的线性相加可能会造成“溢出”，通常由两个16bit的整数表示，这两个整数相加可能会造成溢出，向上或向下溢出。所以在混音算法中需要具备处理溢出情况的能力。

（2）两个音频流的振幅表示声音的能量水平，需要混合的两个声音可能存在一个声音大一个声音小的情况，站在用户角度考虑的话，会希望两个声音混合之后听起来能够均衡一些。所以需要考虑这两个声音振幅之间的权重，或者是调节两个声音之间的音量。通常，在直播过程中采集到的主播声音相对较小，而文件读取的音频声音反而较大，这个时候就会保持主播的声音音量不变，调节背景音乐音量后再进行混合。

在直播app开发的过程中，混音技术的使用还是十分常见的。但是在直播的场景应用中，混音技术不会作为单独的技术进行使用，通常都会与其他技术一起使用。直播app中各种技术的灵活运用，不仅可以创造出主播和用户都广为喜爱的直播玩法，还可以增强用户留存率，从而提高直播平台的用户活跃度，实现最终流量变现的目的。

（本文声明原创，转载请注明出处。www.yunbaokj.com）

上一篇：直播软件系统中的即时通讯开发技术

声明:

以上内容为云豹科技作者本人原创，未经作者本人同意，禁止转载，否则将追究相关法律责任

云豹科技10年专注软件开发

云豹科技旗下热门产品有：直播系统、短视频系统、一对一视频聊天系统、陪玩约单系统、语音社交系统等

商业开源源码100%提供，免费全球搭建部署、提供技术支持/培训服务、产品文档齐全

承接定制开发，免费协助整理需求文档，提供快速低成本一站式技术服务

解决方案&更新日志