微信摇一摇专利 - 基于节目的交互方法和装置

微信摇一摇识别歌曲

在 2013 年 3 月左右,微信的「摇一摇」除了可以找人之外,还可以根据声音来识别歌曲。到了 2014 年 5 月前后,还加入了电视节目的识别功能。

微信摇一摇识别电视节目

一直对这个功能的实现很好奇,本周经过一番查找,终于找到了一个专利号为 CN201410605680.X 的专利《基于节目的交互方法和装置》。

专利简介:

申请(专利权)人:腾讯科技(深圳)有限公司

发明(设计)人:张小龙;张颖;胡仁杰;郑秋明;孙博;侯杰;谢达东;刘海龙

申请日:2014.03.13

公开(公告)日:2014.12.31

专利摘要:

一种基于节目的交互方法,其特征在于,所述方法包括:

  • 在播放节目的过程中,获取所述节目的音频信息,所述音频信息包括所述节目的片段音频信息以及所述节目中插入的指定音频信息;
  • 生成所述音频信息的音频指纹;
  • 发送所述音频指纹,所述音频指纹用于匹配出节目信息;
  • 当接收到与所述节目信息对应的交互页面时,显示所述交互页面;
  • 基于在所述交互页面的互动操作,与所述节目进行交互。

界面示意图

图 5A 是本发明实施例提供的功能选项界面示意图。
图 5B 是本发明实施例提供的摇动界面示意图。

基于腾讯的强大研发实力,除了上面的专利简述外,专利书内还包含了从手机设备、后台服务器的所有软硬层面的结构与流程设计,全方位保护。

终端的结构示意图

图8是本发明实施例提供的一种终端的结构示意图;

服务器的结构示意图

图9是本发明实施例提供的一种服务器的结构示意图。

这个专利案利用了「音频指纹」这个关键技术。关于音频指纹,百度百科有比较简单的描述。与其有较高相关度的另外一个术语「声学指纹」,在维基百科有更详尽的描述:

声学指纹(Acoustic fingerprint)是通过特定算法从音频信号中提取的一段数字摘要,用于识别声音样本或者快速定位音频数据库中的相似音频。音频指纹是指可以代表一段音乐重要声学特征的基于内容的紧致数字签名,其主要目的是建立一种有效机制来比较两个音频数据的感知听觉质量。

关于这个专利的保护范围,专利档案最后有这样的描述:

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

意思就是,通过「音频指纹」可匹配除了歌曲和音频之外其他类型媒体,只要具有「同等精神和原则」,并且匹配到歌曲、电视节目后,后续所有交互方式均被保护。

呵呵哒。

可以看出来,无论是歌曲识别,还是节目识别,这个专利描述的都是基于「音频指纹」识别技术的一套较简单的交互流程,并未涉及到真正尖端的技术发明。我们可以从中学习到,除了发明新的轮子——研究「黑科技」之外,还可以利用现有的技术来匹配合适的使用场景,组合出各种新颖技术。

以上。

相关链接:

许可君.Suer wechat
本文同步更新至我的公众号与知乎专栏