本人基于自我学习目的搭建了生猪音频实时分类系统,使用百度 EasyDL 零门槛AI开发平台训练音频分类模型,然后发布为公有云在线服务;之后使用 javascript + axios + wavesurfer 搭建前端展示界面用来展示实时分类的效果。

1. easydl 训练音频分类模型

1.1 上传数据并训练音频分类模型

    1. 打开 easydl 官网:https://ai.baidu.com/easydl,点击立即使用,选择模型类型为声音分类。
      在这里插入图片描述
    1. 进入声音分类界面后,点击模型中心的创建模型,填写需要创建的相关信息。
在这里插入图片描述
    1. 在 EasyData 数据服务中的数据总览中点击创建数据集,并给定数据集名称。
在这里插入图片描述
    1. 在数据总览中该数据集中点击导入按钮导入数据集,并按照要求导入有标注信息的压缩包数据。
在这里插入图片描述
    1. 数据要求:以文件夹命名分类,一个文件夹下就是一类数据,文件夹名就是该类别名,其中单个音频文件时长需要超过1秒。
      例如:文件夹1命名为的 pig_eat 其中文件全为猪吃食叫声,文件夹2命名为的 pig_howl 其中文件全为猪嚎叫声。
在这里插入图片描述
    1. 查看数据是否导入成功并识别出有标记信息,未标记成功的数据可以在线进行重新标注。
在这里插入图片描述
    1. 点击模型中心的训练模型,选择刚刚创建的模型和数据集,训练方式选择公有云部署。然后点击开始训练进行模型训练。
在这里插入图片描述
    1. 在模型中心的我的模型中可以看到训练的结果。
在这里插入图片描述

1.2 发布训练好的模型

2. 前端部署

  1. 下载代码 https://gitee.com/qiaoyukeji/pigAuido_reco_show

  2. 替换API Key等后浏览器访问以下链接
    注意:将 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/app/list 中的 API Key 和 Secret Key填入下面的client_id 和client_secret后面

https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=ABC&client_secret=ABC
在这里插入图片描述
  1. 将上图 access_token 的一串数字填入替换 index.js 中第52行的access_token处即可。

  2. 前端界面展示

在这里插入图片描述

本文首发于本人博客:https://blog.gitnote.cn/post/pigAuido_reco_show/

版权信息: CC BY-NC-SA 4.0 (自由转载-非商用-相同方式共享-保持署名)