嘉立创产业服务站群
必应搜索
发作品签到
专业版

ESP-Spot:ESP32-S3 AI 语音交互核心模块

工程标签

3.1w
0
0
96

简介

ESP-Spot 是一款基于 ESP32-S3 / C5 的 AI 语音交互模块,自供电,集成IMU、麦克风和两个扬声器,自带触摸传感器,适合作为桌面语音助手或毛绒玩具的智能核心。

简介:ESP-Spot 是一款基于 ESP32-S3 / C5 的 AI 语音交互模块,自供电,集成IMU、麦克风和两个扬声器,自带触摸传感器,适合作为桌面语音助手或毛绒玩具的智能核心。
复刻成本:60

开源协议

GPL 3.0

(未经作者授权,禁止转载)
创建时间:2025-03-07 13:18:52更新时间:2025-04-15 09:02:12

描述

ESP-Spot:AI 语音交互核心模块

介绍图片.png

项目简介

ESP-Spot 是一款基于 ESP32-S3 / ESP32-C5 的 AI 动作语音交互核心模块,专注于语音交互AI感知与智能控制,适用于智能玩具、语音助手、家居控制等物联网应用场景。它不仅可以通过离线语音实现唤醒、AI对话等功能,而且通过ESP32-S3自带的触摸/接近感应外设实现玩偶触摸感知,同时设备内置加速度传感器, 可以识别玩偶姿态与动作,从而实现更丰富的交互。

视频展示

用触摸交互升级大模型 AI 玩具【ESP-SPOT】

> 欢迎大家二次开发,一起感受 ESP-Spot 的魅力与乐趣

版本更新记录

  • V1.2(2025年4月11日):发布了 V1.2 版本硬件。调整了按键、LED灯与USB口的位置,用于适配新版高颜值外壳,原理图和功能与 V1.1 版本完全一致。
  • V1.1(2025年3月13日):第一次开源版本。

关于固件

当前开源的默认固件接入小智,作为语音大模型聊天机器人。
快速体验:esp-launchpad
程序固件提供在附件中,开源代码持续更新中,欢迎沟通交流!

功能展示

  • 大模型 AI 对话功能

ESP-SparkBot 可以通过接入大语言模型,实现对话聊天功能,目前已对接:豆包、小智AI
其它平台正在陆续适配中...
具体实现代码请参考源码仓库

duihua (2).gif

  • 触摸感知功能

ESP-SPOT 支持 5 个外接触摸通道,可连到金属片作为毛绒玩具的感知器官,并且每个通道均支持接近感应,从而实现丰富的玩偶感知。

640.gif

  • 动作识别功能

ESP - SPOT 这款 AI 玩具内置了先进的加速度与角速度传感器,它们犹如敏锐的 “神经末梢”。加速度传感器通过测量物体在不同方向上由于加速或减速所产生的力,精准捕捉自身速度变化情况;角速度传感器则利用陀螺仪原理,能精确感知围绕各个轴的旋转速率。凭借这两种传感器的协同工作,ESP-SPOT 可准确感知自身在空间中的姿态,为用户带来更智能、更有趣的互动体验 。

641 (1).gif

3D 结构设计

a172fb46-5b26-4b19-8e16-fdb580fa4659.jpg
v1.1 外壳适配 v1.1 版本的硬件,造型为笑脸小方盒,盖板可推开,笑脸嘴部可点击 KEY 按键,笑脸眼睛为 BOOT 按键与指示灯。

v1.2 外壳适配 v1.2 版本的硬件,造型为乐鑫 logo 坐立小人,盖板可点击 KEY 按键,BOOT 键不可点击,乐鑫 LOGO 小圆孔处为指示灯,可自行增添导光柱细节。
> 请注意,乐鑫 LOGO 仅作为造型展示,受知识产权保护,不可用于商用。如您有商用需求,需要修改 3D 文件 LOGO 部分。

底座部分需搭配磁吸充电线材配件,选择 Type-C 接口,轴承部分可作为小人脖子连接,可具有俯仰姿态,京东购买地址

细节展示:
eb78dc0a-453f-40d6-a675-f21b8fa3682f.jpg

复刻教程

在装配前请准备以下材料:

序号描述
13D 打印外壳
2300mAh 电池 型号:ZCLP300
3M2*4mm 螺丝
4ESP-Spot MainBoard
5ESP-Spot SubBoard

投板注意事项:

  1. 上板排针推荐长 15mm
  2. 在使用ESP32-S3时,R45、R33、R34三个电阻请勿上件,在使用ESP32-C5时需要上件
  3. 排针 H5、H6、H7 默认用于调试可以不上件
  4. 打板请选择板厚1.2mm

V1.1 版本硬件装配

ESP-SPOT 包含 MainBoardSubBoard 两块板子,通过排针H1、H2 三明治结构安装(注意天线方向,无防呆处理),中间夹电池,上板排针推荐长15mm,成品示意图如下:

image.png

image.png
MainBoard 涉及的器件较多,推荐使用 SMT 加工。SubBoard 主要负责电池管理,底部装配两个 2014B 扬声器以增加发声效果。SubBoard 用螺丝与外壳简单固定,装配时注意外壳笑脸方向为 KEY 按钮。

V1.2 版本硬件装配

3D 结构爆炸图

image.png

装配步骤:

先装 SubBoard 配件 2 SPK 和电池,板子上有示意字样,展示图如下:
image.png

剪掉 SPK 的耳朵,装入外壳,金属片朝下。SubBoard 排针引脚戳出来的部分也需要用尖嘴钳剪掉。
image.png

装好后示意图:
image.png

按图示方向插上 MainBoard:
image.png

image.png

外壳盖板 3D 结构支撑需要去除干净
image.png

image.png

装配盖板

image.png

充电底座

image.png

成品展示

image.png

硬件电路设计说明

主体电路设计

ESP-SPOT 硬件部分主要包含电源管理、MCU、IMU、音频四个部分,总体硬件框图如下:

image.png

供电方式

ESP-SPOT 支持 USB-Type-C锂电池两种供电方式,300mAh 的电池搭配 ESP32 的功耗管理可以实现约一小时的持续对话。主电源为 5 V,由 USB 提供。辅助电源为 3.7 V,由电池提供。USB 供电时同时会为电池充电。充满电时充电指示灯熄灭。
ESP-Spot 预留了外部输出功能。在板级设计时充分考虑了外设和 MCU 的功耗管理,通过控制 MCU_VCC_CTL 与 PREP_VCC_CTL 引脚支持三种工作状态,并可以在三种工作状态间灵活切换:

image.png

工作状态描述电源控制
Active所有芯片均处在工作状态,能正常语音对话,支持按键、摇晃和命令词唤醒MCU_VCC_CTL = 1 PREP_VCC_CTL = 1
Deep SleepMCU 供电,且处于深度睡眠状态MCU_VCC_CTL = 1 PREP_VCC_CTL = 0
Power Down所有芯片均下电,仅能通过按键唤醒MCU_VCC_CTL = 0 PREP_VCC_CTL = 0

如下图所示,当 USB 供电(VBUS)存在、KEY 被按下或者 MCU_VCC_CTL 引脚为高三者中任意条件满足时会自动拉高POWER_EN,此时MCU获得供电,当 PREP_VCC_CTL 引脚拉高时 CODEC_3V3 使能,音频编解码芯片工作。

image.png

image.png

音频

ESP-Spot 使用了 ES8311 芯片作为音频采集并使用 NS4150B 作为音频放大器,为了取得更好的拾音效果,选择ZTS6216 模拟麦克风作为拾音器,同时拾音部分地平面与数字地分别铺铜。由于 ES8311 在断电时会从I2C总线上吸收约 2mA 漏电流,为了进一步降低 DeepSleep 时功耗,使用 MOS 管将 ES8311 在断电时从I2C总线上物理移除。

image.png

硬件注意事项:

  1. 电池电压采样、WS2812 和 CodeC 的电源域均由 PRER_VCC_CTL 控制
  2. ES8311 MCLK没有连接,请在软件中正确配置ES8311的时钟源

二次开发指南

ESP-Spot 上板也可作为一块带音频的 ESP32 开发板单独使用,VIN 可以允许 3.3->5V 供电,如果需要默认使能 3V3 电源域,请将 VBUS 上拉,VBAT 接 3.3V。其引出的引脚如下:

image.png

物料清单

附件列表

  • s3_spot_factory.bin : 小智语音交流固件
  • spot-v1.1-外壳.zip :v1.1的外壳,包含面板和主体。
  • spot-v1.2-外壳.zip :v1.2的外壳,包含面板主体和底座。

QQ 交流群2 (1群已满)

扫描下方二维码加入学习交流群!

266e54eb0ac1d7a110466a8c71ae99ff_compress.jpg

已知问题

暂无

如果你在复刻之后发现有问题,欢迎评论指正!!!

设计图

未生成预览图,请在编辑器重新保存一次

BOM

暂无BOM

附件

序号文件名称下载次数
1
s3_spot_factory.bin
431
2
spot-v1.1-外壳.zip
110
3
spot-v1.2_外壳.zip
126
克隆工程
添加到专辑
0
0
分享
侵权投诉

评论

全部评论(1)
按时间排序|按热度排序
粉丝0|获赞0
相关工程
暂无相关工程

底部导航