Azure Speech · 自动润色 · AI 语音输入

落笔生花 出言成章

以声音驱动思想,以语言雕琢表达。

下载 Windows 版 下载 Mac 版

查看功能介绍 →

特色功能

言墨实现了什么

从语音到输出,每一环节都经过打磨。

🎙️

语音输入

实时转录,低延迟响应,准确识别多种语言。

AI 润色

口语自动润色为书面语,多种风格可选。

🎯

场景适配

根据应用场景动态增强识别结果,集成多种agent辅助各类输入需求

📟

命令模式

自动识别语句含义,文字转表格、检索诗词,语音即指令。

🌐

实时翻译

识别同步翻译,各国语言自由切换,翻译风格可配置。

个性化定制

一个词自动展开完整内容;自定义专有名词与生僻字,提高识别精准率,无需反复纠正。

🖥️
跨平台
Windows / macOS
🤖
高智能
语音驱动 vibe coding
🌐
多语言
自由切切换不同语言
强润色
口语变书面,一步到位
快响应
即时转写,零等待感

产品演示

看 言墨 如何工作

点击播放
app应用

麦克风代替键盘,重构工作方式

按下快捷键即可开口,自动转录润色,文字插入光标。

自动润色
自动润色 口语转书面,自动润色;说错直接重述,言墨识别最终意图,只提交正确结果
🎙️ 语言识别 · 实时转写 说话代替打字,语音实时转为文字,直接落入编辑器光标位置
🎙 语音输入
"帮我快速生成一条会议通知"
场景适配 · 会议通知
会议通知
请各位于今天 15:30 到 A 会议室参加项目评审会,
请提前 10 分钟到场并准备汇报材料。
—— 言墨已根据当前场景自动生成
🧩 场景适配 感知当前语境与编辑器,结合语音指令自动生成匹配场景的文字,窗口内可一键生成会议通知等内容。
查看完整功能介绍
🎙️ 核心体验

出口成章,
真情实感自然流露。

语音输入与 AI 润色深度绑定——口语实时转写为文字,随即润色为书面表达。思路连贯,墨随其声。

  • 实时转写,精准落入光标
  • 停止即润色,口语自动变书面语
  • 多种润色风格,底部状态栏随时切换
  • 全场景兼容,无缝接入任意应用
停止识别后自动润色
✨ 识别结果
默认 简洁 正式 自定义
原始 那个,嗯,就是把那个数组啊,遍历一下。然后呢,把那些空的值筛掉
润色 遍历数组,并过滤掉其中的空值。
VS Code VS Code Extension · 已上架 Marketplace

代码编辑器里的
语音输入助手

言墨 VS Code 插件将编辑器中打开的文件作为文本开放给客户端,配合 GitHub Copilot、Claude Code 等 Agent,让 Vibe Coding 更顺手自然。

parser.py — yanmo — Visual Studio Code
言墨
parser.py
1# parser.py
2 
3# parse_input: Parse a 'name|value' input string into a structured dictionary.
4def parse_input(raw):
5  parts = raw.split("|")
6  return {"name": parts[0], "value": parts[1]}
7 
8# format_table: Build newline-delimited table text from 2D row data.
9def format_table(rows):
10  return "\n".join([" | ".join(row) for row in rows])
11 
12def print_each_element(arr):
13  for item in arr:
14    print(item)
言墨 · 录音中
Python
Ln 5, Col 1
Agent 协同
插件会将 VS Code 中打开的文档与工作区开放给言墨,精准识别其中的函数、变量与文件名;结合 Code Agent 让口述顺势落成高质量的代码。
言墨 · yanmo
实时口译原文
给 parse_input 和 format_table 都补上详细注释
加一个函数,打印数组中的每一个元素
AI 修正与润色
为 parse_input 与 format_table 分别补全详细注释,说明参数、输出与处理目的。
在现有代码后插入 print_each_element(arr),逐项输出数组元素。
Agent 支持

支持接入 OpenClaw 等 Agent,
让言墨成为统一的入口。

言墨可以把语音识别、内容整理和上下文输入接到 OpenClaw 等多种 Agent 工作流里,让你用更自然的方式发起调用。

  • 说话即可发起 Agent 指令,减少手工输入成本
  • 识别结果可直接作为 OpenClaw 等 Agent 的上下文输入
  • 在不同 Agent 工作流之间切换,仍保持同一套语音入口
🧠 智能增强

听音知境,理解不是逐字照搬

理解语境语义,说错了重述一句即可纠正。行业术语一次录入,长期精准。

  • 语境感知,精准识别专业术语
  • 重述即纠错,无需手动退格
  • 自定义词典,行业术语零误差
  • 触发词展开,常用内容一声即至
🔍 情景感知
当前光标上文:「我们需要优化 SQLite 查询…」
语音输入:「加一个索引」
→ 补全输出:「为 user_id 字段创建索引以提升查询性能」
🔄 动态修正
说:「发送邮件给张三」发送邮件给张三
重述:「不对,发送给李四」
→ 最终输出:「发送邮件给李四」
📖 自定义词典
Claude Code
识别质量对比(添加词典前后)
原文: Claude Code 是一个很好用的代码 agent
添加前: 识别为「Cloud Code(云代码) 是一个很好用的代码 agent」
添加后: 准确识别「Claude Code 是一个很好用的代码 agent」
✨ AI 润色

口语变书面,
多种风格一键切。

停止录音后 AI 自动整理措辞,流式实时输出,文字风格多样。

  • 多种内置风格:默认 / 简洁 / 详尽 / 正式 / 轻松
  • 支持自定义 Prompt
  • 集成翻译,口述自动译为目标语言
  • 可随时关闭,切换纯转录模式
润色风格(底部状态栏切换)
默认风格 简洁 详尽 正式 轻松 自定义…
效果对比
原始口述
那个,嗯,就是把那个数组啊,遍历一下,然后呢,把空的那些过滤掉
✨ AI 润色后
遍历数组并过滤掉其中的空值,返回处理后的结果集合。
翻译功能(底部下拉选择目标语言)
中文
遍历数组并过滤掉其中的空值。
US
Iterate the array and filter out null values.
⚡ 快捷短语

快捷词触发,对应信息自动替换。

将惯用语、签名、专业表述凝练为一个触发词。轻声一唤,完整内容即刻铺陈。

  • 自定义触发词与替换内容,数量不限
  • 触发词自动纳入识别词库,转写更精准
言墨
首页
历史
词典
快捷词
设置
👤
问好 ✏ 🗑
感谢您的来信。请问有什么可以帮助您?
我的个人邮箱 ✏ 🗑
Personal@outlook.com
我们的地址 ✏ 🗑
北京市海淀区丹棱街5号
+ 新增
实时识别中…
下午好,我想发一封邮件,问好 下午好,我想发一封邮件,感谢您的来信。请问有什么我可以帮助您? 好的,您可以把文件发到我的个人邮箱 好的,您可以把文件发到Personal@outlook.com 欢迎来访,我们的地址 欢迎来访,北京市海淀区丹棱街5号,期待您的到来!
⚡ 快捷词「问好」已展开 ⚡ 快捷词「我的个人邮箱」已展开 ⚡ 快捷词「我们的地址」已展开
⌘ 命令模式

识别不止转写,更是指令的理解和执行。

言墨识别语音,理解意图,一句话即可触发排版、检索、插入。

  • 说"整理成表格",Markdown 即刻生成
  • 说"来一句李白",匹配诗句直接插入
  • 成语、名言、术语,顺手拈来
  • 口语照单全收,不用字斟句酌
命令模式
一句话发出意图,结果直接落下
识别语音后直接进入结构化执行,不必先想清楚关键词。
实时理解中
排版 检索 插入 知识调用
表格整理 Markdown
“姓名张三年龄 28 职位工程师,帮我整理成表格。”
执行结果
| 姓名 | 年龄 | 职位 |
|------|------|------|
| 张三 | 28 | 工程师 |
🕘 历史记录

表达有据可查,关键内容随时找回。

言墨按时间保存每次语音输入与润色结果,支持按日期筛选、快速检索与复用,不怕灵感漏掉。

  • 支持按日期范围筛选,精确定位历史内容
  • 90 天记录留存,条数无限制
言墨
首页
历史
词典
快捷词
设置
👤
历史记录
往事如风,字里行间皆留痕
2026-04-16
2026 年 4 月
1234 56789 1011 121314 15161718 19202122232425 2627282930
支持查询最近 90 天记录,条数无限制
2026-04-16 15:49:24 | 46 字 识别
欢迎使用言墨语音助手!我会元气满满、聪明又贴心地陪着你。
2026-04-16 15:48:06 | 17 字 识别
你好呀,我是言墨喔,很高兴认识你!
2026-04-16 15:42:34 | 28 字 识别
你看看嘛,把"你好你好"和我说的内容都帮我识别成文字哦。
2026-04-16 15:42:12 | 30 字 识别
主界面里已经有 5.8 版本啦,我这个小 AI 也确认过咯~
2026-04-16 15:42:06 | 36 字 识别
现在怎么进不去主界面了呀?人家怎么点都插不进去,嗯嗯…
2026-04-16 15:41:54 | 48 字 识别
欢迎使用研磨呀!我是一只可可爱爱的 AI 小助手…
跨平台

支持Windows、Mac平台,
开箱即用。

无论在本地应用还是网页端,界面与操作保持一致,切换设备也不会打断你的节奏。

  • 覆盖 Windows / macOS 双平台
  • 适配各类有输入需求的软件场景
  • 在不同软件里都按同一套方式使用,无需重新适应
Windows
macOS
VS Code
Outlook Outlook
OneNote OneNote
Word Word

您的声音,
只属于您。

言墨不单独收集任何语音数据,语音识别通过 Azure Speech Service 完成,识别结果仅用于插入编辑器。这不是一项功能,这是我们的底线。

您可能想知道

如何配置 AI 模型与语音服务?

在应用设置中,您可灵活配置后端 AI 大模型,或通过 Microsoft 旗下 GitHub 账户登录快速使用; 语音服务默认配置已支持语音识别,也可按需自定义语音服务终端。

远程桌面场景下可以使用 Yanmo 吗?

可以。在同类型系统的远程桌面场景下,仅需在本地安装 Yanmo,远端机器无需安装也可正常使用。

识别延迟大概是多少?

语音识别采用流式处理,通常说完期间即可看到识别结果。网络状况良好时,实时字幕几乎与说话同步,整体延迟较低。

离线状态下能使用吗?

语音识别依赖云端服务,需要网络连接。但已识别的文字、快捷短语和自定义词典均保存在本地,断网后仍可查看历史记录和编辑已有内容。

识别结果如何插入到编辑器?

识别完成后,文字会自动插入到当前光标所在位置,行为与普通键盘输入一致。同时支持通过自定义快捷调用「言墨」命令模式,随时随地可触发言墨悬浮窗进行语音识别。

言墨

开口,即是写作。

数千名创作者与开发者,将声音变成您最趁手的创作工具。

立即下载