awa Ten+Gemini:Gemini的多模态语音、视频理解能力本地化,广泛应用于智能眼镜、智能语音助手等各种场景,可以识别任何看到的场景并且语音回复 场景:放到手机上随时随地可以体验助手,放在眼睛上就是智能眼镜,gemini真的打开了多模态新的想象空间,大概率会迎来一波智能硬件创新潮 github:[链接登录后可见] 体验地址:[链接登录后可见]