核心 MVP 工具 · AI 驱动

音频转 MIDI 转换器

AI 驱动 · 在线工具 · 注册即送 2 个免费试用积分

上传 MP3、WAV、M4A、FLAC、OGG、WEBM、AAC 音频,或从你拥有 / 已获授权的视频导出的音轨,PureMIDI 使用 AI 音频转写引擎识别音高、起止时间和力度,生成可在任意 DAW 中编辑的 MIDI 草稿。整个过程在浏览器中完成,无需安装任何插件。

转换模式

上传音频

选择支持的音频文件,然后转换为 MIDI。

选择音频开始转换

支持格式:MP3 / WAV / M4A / FLAC / OGG / WEBM / AAC,最大 12MB。

MIDI 试听

先听真实转换示例

这两个样本走的就是线上用户实际使用的生产链路:单声部走 Basic Pitch,整曲模式走 MT3。

单声部旋律

清晰的单音旋律,走 1 credit 的 Basic Pitch 普通模型链路。

1 credit
Basic Pitch
Basic Pitch
17.84 秒 MIDI
17.84 秒 MIDI
1 条轨
1 条轨
18 个音符
18 个音符

原始音频

18 秒 mono WAV

MIDI 试听

Basic Pitch 输出

整曲混音草稿

短 mixed arrangement 走整曲模式,返回 1 个 MT3 多轨 MIDI 草稿。

6-15 credits
MT3
MT3
31.77 秒 MIDI
31.77 秒 MIDI
8 条轨
8 条轨
113 个音符
113 个音符

原始音频

32 秒 stereo WAV

MIDI 试听

MT3 输出

原始片段是 PureMIDI 自有合成 demo;MIDI 是 provider 原始输出,没有人工修音。

工作流程

  1. 01

    上传你的音频

    拖拽或选择本地音频文件,最大 12MB。我们仅在转换期间临时保留你的素材。

  2. 02

    AI 自动转写

    AI 引擎识别每个音符的音高、起止时间和力度,生成可编辑 MIDI 音符。

  3. 03

    下载并继续创作

    几秒后即可下载 .mid 文件,把它拖进 Logic、Ableton、FL Studio、Cubase 或任何 DAW。

适用场景

扒带与翻奏

把清晰主线或独奏片段转成 MIDI 草稿,用于转调、改编和翻奏练习。

DAW 制作素材

录一段哼唱或乐器演奏,立即变成可编辑的 MIDI 灵感。

音乐教学

把学生录音转成 MIDI,便于打谱和回放对比。

Remix 起手

用识别出的 MIDI 草稿作为起点,再换音色和编曲做新版本。

准确度说明

  • 单旋律、清晰人声或独奏乐器识别效果最佳。
  • 复杂混音可先自行分离清晰声部以获得最佳精度,或者直接使用整曲模式(按时长 6-15 积分)生成多轨 MIDI 草稿。
  • 极端混响或低保真录音会降低识别准确率,建议先做轻度降噪。
  • 导出后建议在 DAW 中略做量化与人工微调,得到最佳听感。

单音模式 vs 整曲模式

PureMIDI 提供两种转换模式,选对模式能省积分、一次拿到更好的 MIDI 草稿。

单音模式(1 积分)整曲 / Pro Song(6-15 积分)
引擎Basic PitchMT3
适合独唱人声、吉他、贝斯等单旋律整曲混音、和弦钢琴、多乐器轨
输出单轨 .mid(音高 + 时值)多轨 .mid(旋律、贝斯、和弦、鼓等)
选择时机手上有干净、独立的声部手上是完整混音,想一次拿到所有声部
DAW 内置PureMIDI
session 内单旋律 clip最快——无需上传可用,但多一步上传
和弦 / 复调功能有限或不支持整曲模式(MT3)支持
整曲多轨不支持一次上传 → 旋律、贝斯、和弦、鼓
没装 DAW不可用浏览器打开即用,零安装
跨 DAW 工作流只限一个 DAW标准 .mid 各 DAW 通用

音频格式与识别精度对照

不同格式的音频对 MIDI 识别准确度影响很大,下面是常见格式的实测对比。

格式压缩类型推荐场景识别精度
WAV / AIFF无损录音棚 stem、独奏声部★★★★★
FLAC无损压缩归档级演奏录音★★★★★
MP3 320 kbps有损专辑级商业音频★★★★
MP3 192 kbps有损网络流媒体导出★★★
MP3 128 kbps有损老旧录音 / 通话录音★★
M4A (AAC) 256 kbps有损iOS 录音 / Apple Music★★★★
OGG Vorbis有损游戏 / 开源软件导出★★★

实操建议

如果你能选择,永远先上传无损 WAV 或 FLAC;只有 MP3 时选 192 kbps 以上。低码率 MP3 上传前可以先用 Audacity 导出成 WAV,但识别精度不会因此提升。

按乐器选择工具页

每种乐器有对应的专页,包含该场景下的工作流技巧、DAW 步骤和 FAQ。

相关指南

更好用音频转 MIDI 的工作流文章。

更多 MIDI 工作流

除了音频转换,PureMIDI 还提供多种 MIDI 生成与编辑工具。

Audio to MIDI 上传决策表

为了减少无效转换,先判断你手里的音频类型,再选择对应页面和模式。这样比盲目上传完整混音更容易得到可编辑的 MIDI 草稿。

素材推荐入口推荐模式原因
单人哼唱 / 主旋律Audio to MIDIQuick Melody1 积分,适合单旋律音高识别
完整歌曲 / 混音Audio to MIDIPro SongMT3 输出多轨 MIDI,更适合旋律、贝斯、和弦、鼓
从视频导出的音频Audio to MIDI看素材复杂度选择比上传整段大视频更快,也更稳定
本地 MP4 / MOV 视频Video to MIDIPro Song 或 Quick Melody如果还没导出音频,直接用视频页抽音轨
MP3 文件MP3 to MIDI看素材复杂度选择MP3 页会解释比特率、压缩和常见错误

结果预期

MIDI 保存的是音符,不是原声音色。转换后请在 Logic、Ableton、FL Studio、Cubase、GarageBand 或在线 MIDI 编辑器中选择乐器音色、量化节奏并清理误识别音符。

YouTube、video、audio、MP3 转 MIDI 的正确路径

这些搜索词背后的真实需求是同一件事:把视频或音频里的音乐信息转成可编辑 .mid。PureMIDI 转的是音频轨,不从 YouTube 下载,也不识别视频画面。

转换后快速清理 MIDI

拿到 .mid 后不一定要立刻打开 DAW。先用在线 MIDI 编辑器检查分轨、量化节奏、微调力度,再导出干净文件。

常见问题

音频转 MIDI 是免费的吗?+

免费试用——注册即送 2 个免费试用积分,14 天内有效。无订阅,需要更多次数时一次性购买积分包,详细价格见 /pricing。

支持哪些音频格式?+

目前支持 MP3、WAV、M4A、FLAC、OGG、WEBM 和 AAC,单文件最大 12MB。

可以做 video to MIDI / video 2 MIDI 吗?+

可以,但转的是视频里的音轨,不是视频画面。请先从你拥有或已获授权的视频里导出 MP3、WAV、M4A 或 FLAC 音频,再上传到本页转换。

AI 会专门分离和弦、贝斯和鼓吗?+

单音模式只识别音高与时值,不会单独区分贝斯/和弦/鼓。混音轨建议使用整曲模式(按时长 6-15 积分),它会通过 MT3 生成包含旋律、贝斯、和弦、鼓等声部的多轨 MIDI 草稿。

我的音频会被保留吗?+

我们仅在转换期间临时存储你的文件,转换完成或失败后会按计划清理。我们不会用你的音频训练模型。

为什么我导出的 MIDI 听起来不准?+

复杂混音、混响过强、低频过重或乐器音色非常规时单音模式识别都会变差。可以先分离一个清晰声部再上传,或切换到整曲模式(按时长 6-15 积分)生成多轨 MIDI 草稿。

可以用在 Ableton Live 或 Logic Pro 吗?+

可以。我们输出的是标准 .mid 文件,所有主流 DAW(Ableton、Logic、FL Studio、Cubase、Reaper、GarageBand)都能直接打开。

支持长音频吗?+

当前单文件最大 12MB(约 5-10 分钟)。后续会通过更高额度的积分包逐步支持更长文件和批量转换。

单音模式和整曲模式有什么区别?+

单音模式(1 积分)使用 Basic Pitch 识别一条旋律线——适合独唱、吉他、贝斯等单旋律。整曲模式(按时长 6-15 积分)使用 MT3 转写整首混音,输出包含旋律、贝斯、和弦、鼓等声部的多轨 MIDI 文件。

该用 PureMIDI 还是 DAW 自带的 audio→MIDI?+

DAW 自带工具(Logic Flex Pitch、Ableton 的 Convert Audio to MIDI)适合对 session 里已有的单旋律 clip 快速转换。PureMIDI 的优势在于多声部/整曲转换、不需要安装 DAW,以及需要多轨 MIDI 输出时。

可以专门转吉他或钢琴录音吗?+

可以——我们有针对乐器优化的专页:吉他转 MIDI 适合电吉他/木吉他录音,钢琴转 MIDI 针对复调钢琴音色优化。两者使用相同 AI 引擎,但提供该乐器场景下的最佳工作流指导。

相关 MIDI 工具