搭建音频在线实时分类系统
本人基于自我学习目的搭建了生猪音频实时分类系统,使用百度 EasyDL 零门槛AI开发平台训练音频分类模型,然后发布为公有云在线服务;之后使用 javascript + axios + wavesurfer 搭建前端展示界面用来展示实时分类的效果。
1. easydl 训练音频分类模型
1.1 上传数据并训练音频分类模型
-
- 打开 easydl 官网:https://ai.baidu.com/easydl,点击立即使用,选择模型类型为声音分类。
- 打开 easydl 官网:https://ai.baidu.com/easydl,点击立即使用,选择模型类型为声音分类。
-
- 进入声音分类界面后,点击模型中心的创建模型,填写需要创建的相关信息。
-
- 在 EasyData 数据服务中的数据总览中点击创建数据集,并给定数据集名称。
-
- 在数据总览中该数据集中点击导入按钮导入数据集,并按照要求导入有标注信息的压缩包数据。
-
- 数据要求:以文件夹命名分类,一个文件夹下就是一类数据,文件夹名就是该类别名,其中单个音频文件时长需要超过1秒。
例如:文件夹1命名为的 pig_eat 其中文件全为猪吃食叫声,文件夹2命名为的 pig_howl 其中文件全为猪嚎叫声。
- 数据要求:以文件夹命名分类,一个文件夹下就是一类数据,文件夹名就是该类别名,其中单个音频文件时长需要超过1秒。
-
- 查看数据是否导入成功并识别出有标记信息,未标记成功的数据可以在线进行重新标注。
-
- 点击模型中心的训练模型,选择刚刚创建的模型和数据集,训练方式选择公有云部署。然后点击开始训练进行模型训练。
-
- 在模型中心的我的模型中可以看到训练的结果。
1.2 发布训练好的模型
-
- 点击公有云在线服务,选择发布新服务,填写api地址,将刚刚训练好的模型进行发布。
-
- 进入网址 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/overview/index 配置公有云部署相关参数。
2. 前端部署
-
替换API Key等后浏览器访问以下链接
注意:将 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/app/list 中的 API Key 和 Secret Key填入下面的client_id 和client_secret后面
https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=ABC&client_secret=ABC
-
将上图 access_token 的一串数字填入替换 index.js 中第52行的access_token处即可。
-
前端界面展示
本文首发于本人博客:https://blog.gitnote.cn/post/pigAuido_reco_show/
版权信息: CC BY-NC-SA 4.0 (自由转载-非商用-相同方式共享-保持署名)