ESP-AI-Protocol
407字约1分钟
2025-6-1
ESP-AI 通信协议是一套专为 边缘 AI 设备 与 云端服务 设计的高性能通信标准。基于统一的协议规范,无论客户端 / 服务端采用何种编程语言实现,均可实现与任何兼容 ESP-AI 标准的 智能硬件 或 云服务 的无缝通信。
一、协议基础参数
- 通信方式:Webscoket
- 数据传输方向:全双工
二、数据帧组成

三、通信流程图

四、WS 服务连接
连接协议:ws | wss
连接地址:node.espai.fun
连接参数:?v=协议版本&device_id=设备ID&api_key=超体秘钥&api_key=是否调试模式 ...其他可选参数见下表
| 参数名称 | 是否必填 | 描述 |
|---|---|---|
| v | 是 | 协议版本,跟随升级日志 |
| device_id | 是 | 设备MAC地址,如:01:02:03:04:05:06 |
| api_key | 是 | 超体秘钥,到开放平台创建超体后可拿到 |
| LITTLE_ROM | 否 | 是否为低内存设备,如:ESP32-C3 |
| AUDIO_BUFFER_SIZE | 否 | 客户端播放音频的缓冲区大小,默认为 20KB |
| spk_sample_rate | 否 | 客户端播放的音频采样率,默认为 16000 |
| spk_channels | 否 | 客户端播放的声道数量,默认为 1 |
| spk_format | 否 | 客户端播放的音频格式,默认为 "mp3" |
| spk_bitrate | 否 | 客户端播放的码率,默认为 32 |
| mic_sample_rate | 否 | 客户端麦克的音频采样率,默认为 16000 |
| mic_channels | 否 | 客户端麦克的声道数量,默认为 1 |
| mic_format | 否 | 客户端麦克的音频格式,默认为 "PCM" |
| language | 否 | ASR 语言,默认为自动识别 |

