语音匹配的android语音、android

2023-09-04 09:52:07 作者:人言可畏

有没有什么办法,我们可以做的声音在Android的匹配?采取下面的场景。

Is there any way we can do voice matching in android? Take the below scenario.

用户在应用程序中的A讲的东西,并通过该应用程序在手机记录下来。 用户B讲的东西,在应用程序,通过该应用程序在手机记录下来。 用户C讲的东西,在应用程序,通过该应用程序在手机记录下来。 在所有这些录音中,用户A来对应用程序发言。由于他的声音已经被记录,应用程序标识这是用户的A。

否则这样的事情。

用户在应用程序中的A你说一句话豪斯医生,并通过该应用程序在手机记录下来。 用户B在App说一句话豪斯医生,并通过该应用程序在手机记录下来。 用户C你说一句话豪斯医生中的应用程序,并通过该应用程序在手机记录下来。 在所有这些录音中,用户A来和单词房子到App说话。由于他的声音已经被记录,应用程序标识这是用户的A。

这是有可能在Android的?哪种方法是可能的吗?我还没有看到任何内置该库,但有周围什么办法?请大家帮忙。

Is this is possible in android? Which method is possible? I haven't seen any built in libraries for this, but is there any way around? please help.

推荐答案

您可能要检查Recognito,做在Java中的文本无关的说话人识别

You may want to check Recognito that does text independent speaker recognition in Java

这是一个自由和开放源码的Apache的lib下2.0许可

It's a FOSS lib licensed under Apache 2.0

https://github.com/amaurycrickx/recognito

免责声明:我是作者: - )

disclaimer: I'm the author :-)

它有一个光依赖于Oracle的javax.sound处理文件,但它应该是直接从主Recognito类中删除这种依赖关系(几个方法来放弃:在PARAMS寻找文件并点击DEL)

It has a light dependency on Oracle's javax.sound for file handling but it should be straightforward to remove this dependency from the main Recognito class (a few methods to discard: look for "file" in params and hit del)

我不知道任何其他开放源码软件的替代品,这将是没有修改的Andr​​oid兼容

I'm not aware of any other FOSS alternatives that would be Android compatible without modifications

有大量的javadoc时,code应该是简单的。

There's plenty of javadoc, the code should be straightforward.

一件事,你会想知道是如何创造的[]与-1.0到1.0之间的值加倍 一开始你可能想看看这确实只是一个16bit的PCM连接codeD文件FileHelper类。

The one thing you'll wonder is how to create the double[] with values between -1.0 and 1.0 For a start you may want to look at FileHelper class which does just that with a 16bit PCM encoded file.

请注意一个字将不足以提取了良好的声乐印刷和事后识别用户

Please note a single word won't suffice to extract a good vocal print and to recognize the user afterwards

有关的过程中,我会说用一个词重复3次,以建立一个平均声乐打印。使用相同的短语的识别时间。

For the process, I'd say use a phrase repeated 3 times to build an averaged vocal print. Use the same phrase at recognition time.

该LIB是文本无关,但它会帮助使用同一个词,如果你需要保持记录短。如果你想它真正的文本无关的(用户说什么,被人认出来),你需要更长的声音样本。

The lib is text independent but it will help to use the same phrase if you need to keep the recording short. If you want it truly text independent (user says anything and gets recognized), you'll need longer vocal samples.

心连心

 
精彩推荐
图片推荐