-
腾讯混元生图 – 腾讯推出的业内首个多轮图文多模态对话和工具化编辑图像为一体的AI生图产品
腾讯混元生图是腾讯推出的业内首个集多轮图文多模态对话和工具化编辑图像为一体的AI生图产品。它不仅可以通过自然语言和图像输入,实现文本到图像、图像到文本的生成能力,同时支持多轮对话,并且支持通过唤起精调面板,进一步编辑生成好的图像,使用户能够精准控制生成的内容,为创作、设计、故事生成等场景提供强大而灵活的工具。 这一开源模型的升级填补了中文原生DiT(Diffusion with Transform…- 60
- 0
-
MuseTalk – 腾讯Lyra推出的音频驱动唇形驱动模型
MuseTalk是由腾讯音乐娱乐集团的Lyra实验室开发的一个实时的高质量音频驱动唇形同步模型,能够根据输入的音频信号自动调整数字人物的面部图像,使其唇形与音频内容高度同步,支持多种语言,并实现每秒30帧以上的实时处理速度。这意味着观众可以看到数字人物的口型与声音完美匹配的效果。 官网入口:https://github.com/TMElyralab/MuseTalk MuseTalk的主要功能特点…- 145
- 0
-
AnimateZero – 腾讯AI团队推出的视频生成模型
AnimateZero是腾讯AI团队推出的一款前沿视频生成模型,它巧妙地融合了先进的视频扩散模型技术,将视频生成转变为一种创新的零样本图像动画解决方案。该模型通过解耦外观与运动过程,实现了从静态图像到动态视频的跨越式生成,无需额外训练数据或实例,仅凭描述性文本即可引导图像生动起来。AnimateZero以其高度灵活性和适应性著称,能够应对多种场景、角色和动作的动画生成需求。其生成的动画不仅清晰流畅…- 98
- 0
-
火山方舟大模型 – 火山引擎推出的大模型服务平台
火山方舟是一个由火山引擎推出的大模型服务平台,面向企业提供模型精调、评测、推理等全方位的平台服务火山方舟集成了国内多个优秀的大模型,如 MiniMax、智谱AI、复旦 MOSS 等,覆盖了自然语言处理、计算机视觉、语音识别等多个领域。火山方舟旨在为大模型的开发、应用、运营提供一站式的解决方案,降低大模型使用的门槛,推动大模型的产业化和普及。火山方舟大模型服务平台拥有强大的分布式计算能力,支持大规模…- 40
- 0
-
元象XChat – 基于元象通用大模型智能聊天助手
元象XChat是一款由元象公司倾力打造的人工智能语言模型,它基于先进的Transformer架构深度训练而成,展现出卓越的自然语言理解与生成能力。这款模型不仅具备广泛的知识储备,能够回答各类问题、提供信息,还能够在文本创作、编程辅助、生活助手等多个领域发挥重要作用。XChat以多语言支持为特色,跨越了语言障碍,使得全球用户都能轻松享受其带来的便利。无论是中文、英语还是其他主流语种,XChat都能实…- 10
- 0
-
灵境矩阵 – 基于文心大模型的智能体(Agent)平台
灵境矩阵是百度推出的基于文心大模型的智能体(Agent)平台。它允许开发者根据自身行业领域和应用场景,选择不同的开发方式来创建智能体。这些智能体可以感知环境、进行决策和执行动作,从而帮助用户高效地完成各种任务。灵境矩阵的一个显著特点是它降低了开发门槛,即使是没有编程经验的人也可以通过零代码或低代码的方式创建智能体。开发者可以通过自然语言描述智能体的角色和功能需求,平台会自动生成相应的智能体。 官网…- 40
- 0
-
文心千帆 – 百度智能云推出的产业知识增强大模型
文心千帆是百度推出的企业级大模型平台,旨在为企业提供一站式的大模型开发和服务解决方案。这个平台不仅包括百度自研的文心一言大模型,还集成了多种第三方开源大模型。文心千帆平台提供了从数据管理、模型定制微调到云端部署的一整套工具链,帮助企业在生成式AI应用中实现高效开发和部署。它涵盖了语音识别、自然语言处理、图像识别等多种AI技术,满足企业在不同场景下的需求。 官网入口:https://qianfan.…- 77
- 0
-
书生·浦语 InternLM – 千亿参数级的人工智能基座模型
书生·浦语 InternLM 由商汤科技与上海AI实验室联合香港中文大学和复旦大学共同开发的多语言的千亿参数级别的人工智能基座模型。它在超过万亿的token数据上进行了训练,因此具有高水平的知识和强大的思维能力。InternLM 在中英文阅读理解、推理任务等需要较强思维能力的场景下表现优秀,并且在多种面向人类设计的综合性考试中表现突出。此外,InternLM 还通过高质量的人类标注对话数据结合 R…- 107
- 0
-
百度智能云客悦 – 百度倾力打造的智能客服平台
百度智能云客悦,作为百度倾力打造的智能客服平台,其旗下的智能外呼平台更是集NLP(自然语言处理)、ASR(自动语音识别)、TTS(语音合成)等前沿人工智能技术于一体,为企业提供高效、智能的公有云外呼服务。该平台能够同时面向多名用户,自动发起外呼通话,极大地提升了企业的营销与服务效率。这款智能外呼平台具备多种优势,如操作便捷、支持构建外呼机器人、支持会话测试、NLU分析、标注、自动推荐问、语义模型训…- 87
- 0
-
昇思MindSpore – 华为推出的全场景AI框架
昇思MindSpore是华为推出的一个全场景AI框架。它旨在实现易开发、高效执行和全场景统一部署三大目标。作为华为在AI领域的核心技术创新成果,MindSpore旨在通过创新的编程范式、高效的执行能力和广泛的场景覆盖,推动深度学习和科学计算的繁荣发展。MindSpore提供了友好的API和Python编程范式,使得AI科学家和工程师能够更轻松地进行模型开发和调试。它支持动态图和静态图统一的编码方式…- 32
- 0
-
lmagen 3 – google推出的文生图大模型
Imagen 3 是由谷歌公司的人工智能研究部门 DeepMind 开发的一款先进的文本到图像生成技术。它能够更准确地理解文字提示,并将其转化为高质量、具有创造性和细节的图像。Imagen 3 在生成图像时,错误和干扰元素更少,能够产生多种风格的图像,如漫画、写实、赛博朋克、水墨、油画和素描等。此外,为了防止 Deepfake 的潜在问题,Imagen 3 使用了一种名为 SynthID 的方法,…- 242
- 0
-
InstructAvatar – 用于生成 Avatar 的文本引导式情感和运动控制
InstructAvatar是一项先进的AI框架,它允许用户通过文本指令来控制虚拟角色的情感和动作。这项技术的核心在于它的自然语言界面,使得用户可以通过简单的文本输入来精确地控制角色的表情和动作。技术上,InstructAvatar利用了一个自动化的注释流程来构建一个指令-视频配对的训练数据集,并配备了一个新颖的双分支扩散式生成器。这个生成器能够同时预测音频和文本指令下的虚拟角色。实验结果表明,I…- 38
- 0
-
V-Express – 腾讯推出的动态视频生成工具
V-Express是由南京大学和腾讯AI实验室共同开发的一项技术,它可以将单张照片生成为视频。这项技术能够根据不同的信号控制视频内容,例如声音、姿势、图像参考等。它特别注重确保即使是弱信号,比如音频,也能有效地影响视频生成,使得生成的视频更加逼真和多样化。最近的更新包括优化内存使用,支持生成更长的视频,以及发布了技术报告。如果你对这个项目感兴趣,可以在GitHub上找到相关的代码和模型。 官网入口…- 94
- 0
-
孟子生成式大模型 – 澜舟推出的生成式可控大语言模型
孟子生成式大模型,也被称为孟子 GPT,是由澜舟科技研发的一款功能强大的生成式可控大语言模型。它能够通过多轮对话,在特定场景中帮助用户完成各种工作任务,包括内容生成、语言理解、知识问答、推理、代码理解和生成、金融任务等。这个模型结合了最新的语言模型技术,通过理解和生成自然语言,为用户提供智能而直观的操作体验。它支持多种复杂任务,如角色扮演、阅读理解、文案写作等,并具有丰富和强大的基础能力。此外,孟…- 43
- 0
-
可灵大模型 – 快手打造的视频生成大模型
可灵大模型(Kling)是由快手大模型团队自研打造的视频生成大模型。它具备强大的视频生成能力,能够生成长达2分钟、1080p分辨率的视频。可灵大模型采用3D时空联合注意力机制,能够生成符合物理规律的大幅度运动视频,并模拟真实世界的物理特性。这个模型可以将用户的文本描述转化为具体的画面,生成电影级的高质量视频。它支持多种视频宽高比,适用于多样化的视频制作和内容创作需求。除了强大的视频生成能力外,可灵…- 63
- 0
-
可图大模型KOLORS – 快手自研的文生图大模型
可图大模型KOLORS是快手自研的文生图大模型,它具备强大的图像生成能力,致力于将人工智能与艺术创作相结合。支持文生图和图生图两类功能,已上线20余种AI图像玩法。目前,用户可以通过“可图大模型“官方网站和微信小程序,免费使用各项Al图像功能。值得注意的是,可图只需一张图片和几秒钟时间,便可生成一套AI图像。 官网入口:https://kolors.kuaishou.com/ 主要功能特点: 文生…- 133
- 0
-
天壤小白大模型 – AI场景应用开放平台
天壤小白大模型是基于语言大模型的AI应用开发平台,无需代码开发,就能快速、灵活搭建个性化的AI应用。可以帮助用户实现知识客服、广告文案、总结摘要、多语言翻译、新闻稿写作、会议提纲等多个场景的AI应用服务。同时提供了一些AI工具组件,如语义搜索、向量数据库等,以及一些AI场景应用的示例。 它是一个专业的AI技术和服务提供商,为企业、政府机构和个人提供可靠、定制化的大模型解决方案。另外还有一个天壤智能…- 98
- 0
-
怪兽AI知识库大模型 – 企业知识库大模型/智能AI问答机器人
怪兽智能一站式AI企业知识库搭建系统,企业知识库大模型训练,智能企业客服,先进的企业知识库 + 智能的AI问答机器人,轻松集成在直播平台/网站/APP/小程序等三方应用做电商智能问答客服,企业聊天机器人,直播回复。怪兽AI知识库大模型集企业知识库与智能AI问答于一体的平台。通过零代码方式,企业可快速搭建并管理知识库,支持多人协同工作,确保信息安全。怪兽AI的AI问答机器人能精准回复用户问题,提升客…- 65
- 0
-
商汤商量拟人大模型 – 商汤科技AI拟人大模型/情感交流新体验
商汤商量拟人大模型是商汤科技(SenseTime)研发的一款高度拟人化的AI模型。该模型利用先进的自然语言处理(NLP)和深度学习技术,为用户创造出具有独特个性和深度的虚拟人物。这些虚拟人物能够在各种场景和应用中与用户进行自然而流畅的交互,提供情感陪伴、角色互动、AI分身和游戏角色扮演等多种功能。 官网入口:https://character.sensetime.com/character-wb/…- 104
- 0
-
阿里云百炼 – 通义大模型/自然语言处理,助力企业全面AI转型
阿里云百炼是一个基于通义系列大模型和开源大模型的一站式大模型服务平台。该平台集成了国内外主流优质大模型,并提供了模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。该模型旨在帮助企业和开发者快速构建、部署和应用大规模人工智能模型。它支持开箱即用的应用调用、大模型训练微调以及一站式在线灵活部署,能够满足多种AI应用场景的需求。…- 746
- 0
-
华知大模型 – 同方知网与华为联合研发的中华知识大模型
华知大模型是由同方知网与华为公司联合研发的一款专业基础大模型。这款模型基于先进的人工智能技术,旨在为教育、科研、政务、医疗、企业等多个领域提供精准、高效的知识服务。华知大模型结合了同方知网在知识服务领域的深厚积累与华为公司在人工智能领域的先进技术,通过整合海量的高质量语料数据,为用户提供全面、丰富的知识资源。它不仅可以处理传统的文本数据,还能处理图像、音频等多模态数据,实现更广泛的信息获取和理解。…- 1.2k
- 0
-
Imagen 3 – 谷歌推出最新文生图模型
Imagen 3 是由 Google DeepMind 开发的最新文本到图像(Text-to-Image)生成大模型,该模型于2024年5月14日(美国当地时间)在谷歌的I/O开发者大会上震撼发布。Imagen 3 凭借其卓越的性能,能够精准地根据文本提示生成高质量、高分辨率的图像,其细节丰富、光照效果出色,为用户带来了前所未有的视觉体验。该模型支持多种视觉风格,无论是追求照片级的真实感,还是偏爱…- 41
- 0
-
Veo – 谷歌DeepMind推出的高分辨率、长视频生成AI模型
Veo是谷歌DeepMind推出的一款AI视频生成模型,它能够根据简短的文本描述或图像生成高质量的视频内容。该模型支持使用文本生成视频,能创建超过60秒的1080P视频,并支持多种电影风格和更好地理解自然语言。Veo对自然语言有深刻的理解,能够准确解析用户的文本提示,包括复杂的电影制作术语,如“延时摄影”、“航拍”、“特写镜头”等,从而生成与用户描述相符的视频内容。此外,Veo还提供了创意控制层级…- 175
- 0
-
MagicVideo-V2 – 字节跳动开发的AI视频生成模型和框架
MagicVideo-V2 是一款由 字节跳动 公司团队开发的AI视频生成模型和框架。它通过集成文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块,构建了一个端到端的视频生成流程。这款模型能够根据文本描述生成高保真度的视频内容,具有高分辨率和平滑度的特点,为用户提供极佳的观看体验。 官网入口:https://magicvideov2.github.io/?ref 论文地址:https:/…- 180
- 0