搭建音频在线实时分类系统 | 巧遇个人博客

搭建音频在线实时分类系统

· 2022-09-05 · # javascript

本人基于自我学习目的搭建了生猪音频实时分类系统，使用百度 EasyDL 零门槛AI开发平台训练音频分类模型，然后发布为公有云在线服务；之后使用 javascript + axios + wavesurfer 搭建前端展示界面用来展示实时分类的效果。

- - 1. easydl 训练音频分类模型
    - 1.1 上传数据并训练音频分类模型
    - 1.2 发布训练好的模型
  - 2. 前端部署

1. easydl 训练音频分类模型

1.1 上传数据并训练音频分类模型

1. 打开 easydl 官网：https://ai.baidu.com/easydl，点击立即使用，选择模型类型为声音分类。
1. 进入声音分类界面后，点击模型中心的创建模型，填写需要创建的相关信息。

在这里插入图片描述

1. 在 EasyData 数据服务中的数据总览中点击创建数据集，并给定数据集名称。

在这里插入图片描述

1. 在数据总览中该数据集中点击导入按钮导入数据集，并按照要求导入有标注信息的压缩包数据。

在这里插入图片描述

1. 数据要求：以文件夹命名分类，一个文件夹下就是一类数据，文件夹名就是该类别名，其中单个音频文件时长需要超过1秒。
  例如：文件夹1命名为的 pig_eat 其中文件全为猪吃食叫声，文件夹2命名为的 pig_howl 其中文件全为猪嚎叫声。

在这里插入图片描述

1. 查看数据是否导入成功并识别出有标记信息，未标记成功的数据可以在线进行重新标注。

在这里插入图片描述

1. 点击模型中心的训练模型，选择刚刚创建的模型和数据集，训练方式选择公有云部署。然后点击开始训练进行模型训练。

在这里插入图片描述

1. 在模型中心的我的模型中可以看到训练的结果。

在这里插入图片描述

1.2 发布训练好的模型

1. 点击公有云在线服务，选择发布新服务，填写api地址，将刚刚训练好的模型进行发布。
1. 进入网址 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/app/list 中创建应用。
1. 进入网址 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/overview/index 配置公有云部署相关参数。
1. 参考文档声音分类模型如何发布为API，声音分类API调用文档，token鉴权认证机制

2. 前端部署

下载代码 https://gitee.com/qiaoyukeji/pigAuido_reco_show
替换API Key等后浏览器访问以下链接
注意：将 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/app/list 中的 API Key 和 Secret Key填入下面的client_id 和client_secret后面

https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=ABC&client_secret=ABC

在这里插入图片描述

将上图 access_token 的一串数字填入替换 index.js 中第52行的access_token处即可。
前端界面展示

在这里插入图片描述

本文首发于本人博客：https://blog.gitnote.cn/post/pigAuido_reco_show/

版权信息: CC BY-NC-SA 4.0 (自由转载-非商用-相同方式共享-保持署名)

版权申明：CC BY-NC-SA 4.0 (自由转载-非商用-相同方式共享-保持署名)

下一篇

北京超级云计算中心操作训练指南

他日若遂凌云志，敢笑黄巢不丈夫！

Theme by imhanjie, Powered by Gridea, RSS
Made by qiaoyu ©2021-2024 All Rights Reserved