C# WinForm实现语音转文字

C# WinForm实现语音转文字

解决方案goocz2025-06-16 20:19:553A+A-

一、视频演示


二、VS2022


三、核心代码


安装依赖NuGet 程序包 -> 搜索并安装 System.Speech


引用dll

using System;
using System.Speech.Recognition;
using System.Windows.Forms;

语音功能



namespace WinFormsApp6
{
    public partial class Form1 : Form
    {


        private SpeechRecognitionEngine _recognizer;
        public Form1()
        {
            InitializeComponent();
            InitializeSpeechRecognizer();
        }


        private void InitializeSpeechRecognizer()
        {
            _recognizer = new SpeechRecognitionEngine(new System.Globalization.CultureInfo("zh-CN"));


            _recognizer.LoadGrammar(new DictationGrammar()); // 加载默认语法库




            // 识别到语音时触发


            _recognizer.SpeechRecognized += (sender, e) =>
            {
                if (e.Result != null)
                {


                    // 跨线程更新 UI


                    txtResult.BeginInvoke(new Action(() =>


                    {


                        txtResult.Text += e.Result.Text + Environment.NewLine;


                    }));


                }
            };






            // 识别错误时处理


            _recognizer.SpeechRecognitionRejected += (sender, e) =>
            {
                txtResult.BeginInvoke(new Action(() =>
                {


                    txtResult.Text += "[识别失败,请重试]" + Environment.NewLine;


                }));
            };
        }






        private void btnStart_Click(object sender, EventArgs e)
        {


            if (_recognizer.AudioState == AudioState.Stopped)
            {


                _recognizer.SetInputToDefaultAudioDevice(); // 设置默认麦克风


                _recognizer.RecognizeAsync(RecognizeMode.Multiple); // 持续监听


                btnStart.Text = "停止";
            }
            else
            {


                _recognizer.RecognizeAsyncStop();


                btnStart.Text = "开始说话";


            }
        }






        // 窗体关闭时释放资源


        protected override void OnFormClosing(FormClosingEventArgs e)
        {


            _recognizer?.Dispose();


            base.OnFormClosing(e);


        }


    }
}

解决中文识别问题

  1. 安装中文语音包(必需):
  2. 打开 Windows 的 控制面板 -> 语言 -> 语音 -> 确保已安装 中文(简体)语音识别
  3. 若未安装,需通过 Windows Update 或手动安装语音包。
  4. 授予麦克风权限
  5. 右键项目 -> 添加 -> 新建项 -> 选择 应用程序清单文件 -> 取消注释以下内容:xmlCopy Code<requestedExecutionLevel level="asInvoker" uiAccess="false" />
    <!-- 改为 -->
    <requestedExecutionLevel level="requireAdministrator" uiAccess="false" />

运行效果

  • 点击 开始说话 按钮,对着麦克风说话。
  • 识别结果会实时显示在文本框中。
  • 支持连续语音输入(如:“今天天气不错。我想去公园散步。”)。

注意事项

  1. 离线识别准确率较低,适合简单场景。
  2. 若需高精度识别,建议切换为 Azure 语音服务在线方案。
  3. 首次使用可能需在 Windows 设置中启用 语音识别(路径:设置 -> 隐私 -> 语音)。


System.Speech 是 .NET Framework 中用于语音合成(TTS)和语音识别的核心类库,适用于 Windows 平台的语音交互开发。以下是其主要功能及使用要点:


一、核心功能

  1. 语音合成 (Text-to-Speech, TTS)
  2. 通过 SpeechSynthesizer 类实现文本转语音输出,支持同步(Speak)和异步(SpeakAsync)播报方式。
  3. 可自定义语音参数(如语速、音量、性别),并支持将语音输出到音频设备或保存为 WAV 文件。
  4. 语音识别 (Speech Recognition)
  5. 通过 SpeechRecognitionEngine 类实现语音输入识别,需配置语法规则和音频输入源。

二、开发环境配置

  • 依赖条件
    • 操作系统:完整版 Windows(需内置语音引擎)。
    • 开发框架:.NET Framework 4.0 及以上版本。
  • 引用添加
    • 在 Visual Studio 项目中添加 System.Speech 程序集引用(通过“项目→添加引用→框架”)。

三、核心类与用法示例

1. 语音合成(SpeechSynthesizer)

csharpCopy Code


using System.Speech.Synthesis;

// 创建语音合成器实例
SpeechSynthesizer synth = new SpeechSynthesizer();
synth.SetOutputToDefaultAudioDevice();
// 输出到默认音频设备
synth.Speak("Hello, World!");
// 同步播报
synth.SpeakAsync("Async speech");
// 异步播报

2. 扩展功能

  • 保存语音为文件csharpCopy Code
    synth.SetOutputToWaveFile("output.wav");
    synth.Speak("保存到文件");
    synth.SetOutputToNull();
    // 释放资源:ml-citation{ref="4" data="citationList"}
  • 调整语音属性csharpCopy Code
    synth.Rate = 2;
    // 语速(-10 到 10)
    synth.Volume = 80;
    // 音量(0 到 100)
    synth.SelectVoiceByHints(VoiceGender.Female);
    // 选择女声:ml-citation{ref="5,7" data="citationList"}

四、注意事项

  1. 系统兼容性
  2. 仅支持 Windows 平台,依赖系统内置语音引擎(如 Microsoft Speech Platform)。
  3. 异步操作处理
  4. 使用 SpeakAsync 时,可通过 SpeakCompleted 事件监听播报完成状态,避免阻塞主线程。
  5. 资源释放
  6. 调用 SetOutputToNull() 或 Dispose() 方法释放 SpeechSynthesizer 实例。

五、应用场景

  • 信息播报:新闻阅读、天气预报、交通提示。
  • 工业控制:设备状态报警、生产线异常提醒。
  • 教育辅助:电子教材朗读、语言学习发音纠正。

通过灵活调用 System.Speech 的 API,开发者可快速实现语音交互功能,满足多样化的业务需求

点击这里复制本文地址 以上内容由goocz整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!

果子教程网 © All Rights Reserved.  蜀ICP备2024111239号-5