
千影 QianYing 是一款由巨人网络 AI Lab 推出的有声游戏生成大模型,包含游戏视频生成大模型 YingGame 和视频配音大模型 YingSound。通过先进的人工智能技术,千影 QianYing 能够自动生成高质量、有声的游戏视频。YingGame 通过自定义角色、动作控制和物理模拟,创造互动性强的游戏内容;YingSound 则为视频添加高保真音效,实现精确的跨模态对齐和时间同步。千影 QianYing 旨在大幅提升游戏创作效率,助力游戏开发进入创作平权时代,让创意无限延展。
YingGame
YingGame 是面向开放世界游戏的视频生成大模型,由巨人网络 AI Lab 与清华大学 SATLab 联合研发。它首次实现了角色多样动作的交互控制和个性化定制,以及强大的物理模拟特性。用户可以自定义游戏角色,并通过理解用户输入(如鼠标、键盘按键等)控制角色的多种动作和精细的主体控制,生成具有复杂运动和动作连续性的交互性游戏视频。
YingSound
YingSound 是由巨人网络 AI Lab、西北工业大学 ASLP Lab 和浙江大学联合研发的视频配音大模型。它具备超强的时间对齐和视频语义理解能力,能够为各种类型的视频(包括真实场景视频、动漫视频和游戏视频)生成高精细度的音效。YingSound 支持从视频或视频文本结合的方式生成高保真音效,有效提升少样本场景下的生成质量,实现精确的跨模态对齐效果。
技术创新与应用:
千影 QianYing 通过技术层面的多项创新,包括跨模态特征融合、细粒度角色表征、运动增强与多阶段训练策略,结合高效高质量的游戏视频训练数据生产管线,确保生成内容具备高交互能力和多样化应用场景。
前景与展望:
随着千影 QianYing 的发布,巨人网络实现了自研语义大模型、语音大模型及视频大模型的多模态全矩阵布局,加速“游戏+AI”从降本增效向颠覆式创新的转化。未来,千影 QianYing 将极大提升游戏发行内容的创作效率,并为游戏生产管线、交互方式、游戏玩法带来深远影响。
巨人网络 AI 实验室将持续推进模型能力的升级迭代,同时启动“千影共创计划”,对外开放模型技术、模型应用和原创游戏项目的合作共创、应用落地和人才招募,推动游戏创作的平权化,让更多人实现游戏开发梦想。
数据统计
相关导航

EMO (Emote Portrait Alive) 是阿里巴巴集团智能计算研究院的研究团队开发的一个音频驱动型肖像视频生成框架。具体来说,EMO系统基于音频信号驱动来生成肖像视频。用户只需要提供一张参考图片和一段音频文件(例如说话、唱歌的声音),EMO就能够根据音频内容生成一个生动的视频,视频中的人物会展现出丰富的面部表情和多变的头部动作,仿佛照片中的人物正在唱你所制定的语言或歌曲。

华知大模型
华知大模型是由同方知网与华为合作开发的中华知识大模型。它是一个专注于知识服务与科研行业的全栈自主可控的大模型,旨在覆盖政企文教等多个行业场景,并提供30多项通用能力体系。华知大模型的核心特色能力包括智能写作、学术搜问、AI伴读、标准智能问答、机构业务知识智能问答以及图书馆读者智能服务系统等。

AnimateZero
AnimateZero是腾讯AI团队发布的一款AI视频生成模型,通过改进预训练的视频扩散模型(Video Diffusion Models),能够更精确地控制视频的外观和运动,实现从静态图像到动态视频的无缝转换。

IMYAI智能助手
IMYAI智能助手是一款功能强大、简单易用的AI服务平台,集成了GPT4、Claude、Midjourney、Stable Diffusion等先进技术。无论您是需要写作灵感、绘画创意,还是寻求办公助理、生活规划,IMYAI都能提供专业、高效的解决方案。

Cherry Studio
Cherry Studio 是一个支持多模型服务的AI桌面客户端,支持 Windows、macOS 和 Linux,未来还将支持移动端。用户可以通过Cherry Studio无缝集成多种大型语言模型 (LLM),包括 OpenAI、Anthropic 和 Gemini 等,甚至本地部署的模型,确保数据隐私和安全。

HelloMeme
HelloMeme 是一个专注于生成高保真图像和视频内容的 AI 项目,特别是表情克隆技术。通过采用最新的 SD1.5 架构和空间编织注意力扩散模型,HelloMeme 可以轻松将一张图片的表情迁移到另一张图片或视频上,生成效果超越同类工具如 Liveportrait。HelloMeme 支持 ComfyUI 界面操作,非常适用于 AI 数字人、表情包制作和照片复活等领域,带来更自然细腻的表情效果。

YAYI2
YAYI2(雅意2)是中科闻歌推出的新一代开源大语言模型,支持中文、英语等 10 多种语言。基于 Transformer 架构,参数规模达到 30B。YAYI2 采用 2 万亿 Tokens 的高质量语料进行预训练,并结合人类反馈强化学习,确保模型与人类价值观对齐。其多模态交互功能支持图文互生成、PDF 解析等。YAYI2 广泛应用于媒体宣传、舆情分析、政务治理、金融分析等领域,为企业提供 AI 辅助工具和知识库问答系统。

Magi
Magi 的模型是一个可以自动将漫画页转录成文字并生成剧本。该模型通过识别漫画页面上的面板、文字块和角色,实现了全自动的剧本生成功能。
暂无评论...