Shortcut by PoisedShortcut by Poised是一个基于语音的AI助手,旨在通过自然对话的方式提升用户的工作效率。它允许用户通过语音输入快速获得答案、整理思路、起草消息、电子邮件和文档,同时保持工作流程的连贯性。产品通过AI技术将自然语言转换为精炼的文本,并提供多种语言风格选项,满足不同场合的需求。Shortcut by Poised的背景信息显示,它在Product Hunt上发布,并即将推出Windows和移动应用版本,目前Mac版本已可下载。010文案写作# AI助手# 个性化# 工作效率
OpenVoiceChatOpenVoiceChat是一个开源项目,旨在提供一个与大型语言模型(LLM)进行自然语音对话的平台。它支持多种语音识别(STT)、文本到语音(TTS)和LLM模型,允许用户通过语音与AI进行交互。项目采用Apache-2.0许可,强调开放性和易用性,目标是成为封闭商业实现的开源替代品。010语音处理# 开源# 文本到语音# 自然语言处理
WeSTWeST是一个开源的语音识别转录模型,以300行代码的简洁形式,基于大型语言模型(LLM)实现语音到文本的转换。它由一个大型语言模型、一个语音编码器和一个投影器组成,其中仅投影器部分可训练。WeST的开发灵感来源于SLAM-ASR和LLaMA 3.1,旨在通过简化的代码实现高效的语音识别功能。020语音处理# 开源# 机器学习# 自然语言处理
AIAvatarKitAIAvatarKit是一个用于快速构建基于AI的会话头像的工具。它支持在VRChat、集群和其他元宇宙平台以及现实世界的设备上运行。该工具易于启动,具有无限的扩展能力,可以根据用户的需求进行定制。主要优点包括:1. 多平台支持:可以在多种平台上运行,包括VRChat、集群和元宇宙平台。2. 易于启动:用户可以立即开始对话,无需复杂的设置。3. 扩展性:用户可以根据需要添加无限功能。4. 技术支持:需要VOICEVOX API、Google或Azure的语音服务API密钥以及OpenAI API密钥。010头像生成# AI# VRChat# 会话头像
ultravox-v0_4_1-llama-3_1-70bfixie-ai/ultravox-v0_4_1-llama-3_1-70b是一个基于预训练的Llama3.1-70B-Instruct和whisper-large-v3-turbo的大型语言模型,能够处理语音和文本输入,生成文本输出。该模型通过特殊伪标记<|audio|>将输入音频转换为嵌入,并与文本提示合并后生成输出文本。Ultravox的开发旨在扩展语音识别和文本生成的应用场景,如语音代理、语音到语音翻译和口语音频分析等。该模型遵循MIT许可,由Fixie.ai开发。010文案写作# 多模态# 大型语言模型# 文本生成
CuboxCubox是一款专为深度阅读与学习设计的智能工具,利用先进的人工智能技术自动解读文章内容,充分释放用户在高亮标 […]080AI办公工具AI工具导航# AI# annotation# bookmark
度加剪辑度加剪辑是百度官方出品的一款简洁、好用的视频剪辑工具,专为泛知识类作者设计。通过简单易用的剪辑功能、高效准确的智能识别字幕能力以及与百度网盘的打通,帮助用户高效地完成视频作品,降低创作门槛,助力生产优质的作品。080视频工具# ducut# vlog编辑器# 免费视频编辑软件
知意字稿知意字稿专注于通过AI来实现在线声音转文字、声音转成字幕文件,识别准、速度快,能够有效帮助用户快速识别,完成音频整理、文案提取等工作。除了音/视频转文字/字幕等功能外,还提供图片文字提取、表格图片提取等其他各类转写/转换操作。0280AI语言翻译# 字幕制作软件# 录音整理# 录音转文字