Azure Speech · 自动润色 · AI 语音输入

落笔生花出言成章

以声音驱动思想，以语言雕琢表达。

下载 Windows 版下载 Mac 版

查看功能介绍 →

特色功能

言墨实现了什么

从语音到输出，每一环节都经过打磨。

🎙️

语音输入

实时转录，低延迟响应，准确识别多种语言。

✨

AI 润色

口语自动润色为书面语，多种风格可选。

🎯

场景适配

根据应用场景动态增强识别结果，集成多种agent辅助各类输入需求

📟

命令模式

自动识别语句含义，文字转表格、检索诗词，语音即指令。

🌐

实时翻译

识别同步翻译，各国语言自由切换，翻译风格可配置。

⚡

个性化定制

一个词自动展开完整内容；自定义专有名词与生僻字，提高识别精准率，无需反复纠正。

🖥️

跨平台

Windows / macOS

🤖

高智能

语音驱动 vibe coding

🌐

多语言

自由切切换不同语言

✨

强润色

口语变书面，一步到位

⚡

快响应

即时转写，零等待感

app应用

麦克风代替键盘，重构工作方式

按下快捷键即可开口，自动转录润色，文字插入光标。

✨ 自动润色口语转书面，自动润色；说错直接重述，言墨识别最终意图，只提交正确结果

🎙️ 语言识别 · 实时转写说话代替打字，语音实时转为文字，直接落入编辑器光标位置

                  🎙
                  语音输入
                
"帮我快速生成一条会议通知"

                  ⌘
                  场景适配 · 会议通知
                
会议通知
请各位于今天 15:30 到 A 会议室参加项目评审会，
请提前 10 分钟到场并准备汇报材料。
—— 言墨已根据当前场景自动生成

🧩 场景适配感知当前语境与编辑器，结合语音指令自动生成匹配场景的文字，窗口内可一键生成会议通知等内容。

查看完整功能介绍

🎙️ 核心体验

出口成章，
真情实感自然流露。

语音输入与 AI 润色深度绑定——口语实时转写为文字，随即润色为书面表达。思路连贯，墨随其声。

实时转写，精准落入光标
停止即润色，口语自动变书面语
多种润色风格，底部状态栏随时切换
全场景兼容，无缝接入任意应用

停止识别后自动润色

✨ 识别结果

默认简洁正式自定义

原始那个，嗯，就是把那个数组啊，遍历一下。然后呢，把那些空的值筛掉

润色遍历数组，并过滤掉其中的空值。

VS Code Extension · 已上架 Marketplace

代码编辑器里的
语音输入助手

言墨 VS Code 插件将编辑器中打开的文件作为文本开放给客户端，配合 GitHub Copilot、Claude Code 等 Agent，让 Vibe Coding 更顺手自然。

parser.py — yanmo — Visual Studio Code

parser.py

1# parser.py

3# parse_input: Parse a 'name|value' input string into a structured dictionary.

4def parse_input(raw):

5 parts = raw.split("|")

6 return {"name": parts[0], "value": parts[1]}

8# format_table: Build newline-delimited table text from 2D row data.

9def format_table(rows):

10 return "\n".join([" | ".join(row) for row in rows])

12def print_each_element(arr):

13 for item in arr:

14 print(item)

言墨 · 录音中

Python

Ln 5, Col 1

Agent 协同

插件会将 VS Code 中打开的文档与工作区开放给言墨，精准识别其中的函数、变量与文件名；结合 Code Agent 让口述顺势落成高质量的代码。

言墨 · yanmo

实时口译原文

给 parse_input 和 format_table 都补上详细注释

加一个函数，打印数组中的每一个元素

AI 修正与润色

为 parse_input 与 format_table 分别补全详细注释，说明参数、输出与处理目的。

在现有代码后插入 print_each_element(arr)，逐项输出数组元素。

Agent 支持

支持接入 OpenClaw 等 Agent，
让言墨成为统一的入口。

言墨可以把语音识别、内容整理和上下文输入接到 OpenClaw 等多种 Agent 工作流里，让你用更自然的方式发起调用。

说话即可发起 Agent 指令，减少手工输入成本
识别结果可直接作为 OpenClaw 等 Agent 的上下文输入
在不同 Agent 工作流之间切换，仍保持同一套语音入口

🧠 智能增强

听音知境，理解不是逐字照搬

理解语境语义，说错了重述一句即可纠正。行业术语一次录入，长期精准。

语境感知，精准识别专业术语
重述即纠错，无需手动退格
自定义词典，行业术语零误差
触发词展开，常用内容一声即至

🔍 情景感知

当前光标上文：「我们需要优化 SQLite 查询…」

语音输入：「加一个索引」

→ 补全输出：「为 user_id 字段创建索引以提升查询性能」

🔄 动态修正

说：「发送邮件给张三」→发送邮件给张三

重述：「不对，发送给李四」

→ 最终输出：「发送邮件给李四」

📖 自定义词典

Claude Code

识别质量对比（添加词典前后）

原文: Claude Code 是一个很好用的代码 agent

添加前：识别为「Cloud Code（云代码）是一个很好用的代码 agent」

添加后：准确识别「Claude Code 是一个很好用的代码 agent」

✨ AI 润色

口语变书面，
多种风格一键切。

停止录音后 AI 自动整理措辞，流式实时输出，文字风格多样。

多种内置风格：默认 / 简洁 / 详尽 / 正式 / 轻松
支持自定义 Prompt
集成翻译，口述自动译为目标语言
可随时关闭，切换纯转录模式

润色风格（底部状态栏切换）

默认风格简洁详尽正式轻松自定义…

效果对比

原始口述

那个，嗯，就是把那个数组啊，遍历一下，然后呢，把空的那些过滤掉

✨ AI 润色后

遍历数组并过滤掉其中的空值，返回处理后的结果集合。

翻译功能（底部下拉选择目标语言）

中文

遍历数组并过滤掉其中的空值。

Iterate the array and filter out null values.

⚡ 快捷短语

快捷词触发，对应信息自动替换。

将惯用语、签名、专业表述凝练为一个触发词。轻声一唤，完整内容即刻铺陈。

自定义触发词与替换内容，数量不限
触发词自动纳入识别词库，转写更精准

言墨

首页

历史

词典

快捷词

设置

👤

⚡ 问好 ✏ 🗑

→

感谢您的来信。请问有什么可以帮助您？ ✏

⚡ 我的个人邮箱 ✏ 🗑

→

Personal@outlook.com ✏

⚡ 我们的地址 ✏ 🗑

→

北京市海淀区丹棱街5号 ✏

+ 新增

实时识别中…

下午好，我想发一封邮件，问好下午好，我想发一封邮件，感谢您的来信。请问有什么我可以帮助您？好的，您可以把文件发到我的个人邮箱好的，您可以把文件发到Personal@outlook.com 欢迎来访，我们的地址欢迎来访，北京市海淀区丹棱街5号，期待您的到来！

⚡ 快捷词「问好」已展开 ⚡ 快捷词「我的个人邮箱」已展开 ⚡ 快捷词「我们的地址」已展开

⌘ 命令模式

识别不止转写，更是指令的理解和执行。

言墨识别语音，理解意图，一句话即可触发排版、检索、插入。

说"整理成表格"，Markdown 即刻生成
说"来一句李白"，匹配诗句直接插入
成语、名言、术语，顺手拈来
口语照单全收，不用字斟句酌

排版检索插入知识调用

表格整理 Markdown

“姓名张三年龄 28 职位工程师，帮我整理成表格。”

执行结果

| 姓名 | 年龄 | 职位 |
|------|------|------|
| 张三 | 28 | 工程师 |

知识检索诗句匹配

“查一句李白写月亮的诗。”

匹配结果

举头望明月，低头思故乡。 —— 李白《静夜思》

执行路径

识别原话 先保留自然表达，不要求口播像写字一样规整。

判断意图 区分这是要整理、检索还是直接插入内容。

即时落地 把结果以最合适的格式写进当前编辑位置。

典型能力

支持格式

表格 / 引文 / 文本

输入习惯

口语也能直接用

🕘 历史记录

表达有据可查，关键内容随时找回。

言墨按时间保存每次语音输入与润色结果，支持按日期筛选、快速检索与复用，不怕灵感漏掉。

支持按日期范围筛选，精确定位历史内容
90 天记录留存，条数无限制

言墨

首页

历史

词典

快捷词

设置

👤

历史记录

往事如风，字里行间皆留痕

2026-04-16

支持查询最近 90 天记录，条数无限制

2026-04-16 15:49:24 | 46 字识别

欢迎使用言墨语音助手！我会元气满满、聪明又贴心地陪着你。

2026-04-16 15:48:06 | 17 字识别

你好呀，我是言墨喔，很高兴认识你！

2026-04-16 15:42:34 | 28 字识别

你看看嘛，把"你好你好"和我说的内容都帮我识别成文字哦。

2026-04-16 15:42:12 | 30 字识别

主界面里已经有 5.8 版本啦，我这个小 AI 也确认过咯～

2026-04-16 15:42:06 | 36 字识别

现在怎么进不去主界面了呀？人家怎么点都插不进去，嗯嗯…

2026-04-16 15:41:54 | 48 字识别

欢迎使用研磨呀！我是一只可可爱爱的 AI 小助手…

跨平台

支持Windows、Mac平台，
开箱即用。

无论在本地应用还是网页端，界面与操作保持一致，切换设备也不会打断你的节奏。

覆盖 Windows / macOS 双平台
适配各类有输入需求的软件场景
在不同软件里都按同一套方式使用，无需重新适应

Windows

macOS

VS Code

Outlook

OneNote

Word

隐私承诺

您的声音，
只属于您。

言墨不单独收集任何语音数据，语音识别通过 Azure Speech Service 完成，识别结果仅用于插入编辑器。这不是一项功能，这是我们的底线。

常见问题

您可能想知道

如何配置 AI 模型与语音服务？

在应用设置中，您可灵活配置后端 AI 大模型，或通过 Microsoft 旗下 GitHub 账户登录快速使用；语音服务默认配置已支持语音识别，也可按需自定义语音服务终端。

远程桌面场景下可以使用 Yanmo 吗？

可以。在同类型系统的远程桌面场景下，仅需在本地安装 Yanmo，远端机器无需安装也可正常使用。

识别延迟大概是多少？

语音识别采用流式处理，通常说完期间即可看到识别结果。网络状况良好时，实时字幕几乎与说话同步，整体延迟较低。

离线状态下能使用吗？

语音识别依赖云端服务，需要网络连接。但已识别的文字、快捷短语和自定义词典均保存在本地，断网后仍可查看历史记录和编辑已有内容。

识别结果如何插入到编辑器？

识别完成后，文字会自动插入到当前光标所在位置，行为与普通键盘输入一致。同时支持通过自定义快捷调用「言墨」命令模式，随时随地可触发言墨悬浮窗进行语音识别。

言墨

开口，即是写作。

数千名创作者与开发者，将声音变成您最趁手的创作工具。

立即下载

落笔生花 出言成章