覆盖 AI聊天、AI图像、AI写作、AI编程等方向,持续更新产品官网、使用指南、案例与问答。
已收录栏目 36 个 · 已发布内容 1738 篇
Imagen-3是谷歌推出的第三代AI图像生成模型,基于扩散技术,能够从文本描述生成高保真、逼真的图像,并支持精准的文本渲染和多种风格控制。该模型在图像质量、细节丰富度和语义理解上显著提升,适
RunwayML Gen-3是Runway公司推出的最新一代人工智能视频生成模型,代表了当前AI视频生成技术的顶尖水平。它能够根据文本提示、图像或视频片段,生成高质量、连贯且富有创意的视频内容
Veo-3是谷歌DeepMind推出的最新一代AI视频生成模型,能够根据文本描述或参考图像生成高质量、逼真的视频片段。它支持多种风格、长时长视频生成,并具备精准的动作控制和场景一致性,为内容创
CogView-4是智谱AI最新开源的图像生成模型,基于扩散变换器架构,支持中文和英文提示词,可生成高质量、高分辨率图像,适用于创意设计、内容创作、广告营销等多个领域。该模型在文本理解、图像细
Sora-Turbo 是 OpenAI 推出的新一代视频生成模型,基于扩散变换器架构,能够根据文本描述或图像快速生成高质量、连贯且逼真的视频内容。它支持多种分辨率、时长和风格,适用于创意设计、
Sora AI是OpenAI开发的一款突破性文本到视频生成模型,能够根据简短的文本描述,生成长达一分钟的高质量、高保真度视频。它代表了人工智能在理解物理世界和模拟动态场景方面的重大飞跃,为创意
Imagen 3是谷歌DeepMind开发的最新、最先进的文本到图像生成模型,以其卓越的提示词理解能力、无与伦比的图像细节与真实感,以及出色的排版和构图能力,在AI图像生成领域树立了新的标杆。
Veo是谷歌DeepMind开发的一款先进AI视频生成模型,能够根据文本提示、图像或视频输入,生成高质量、连贯且具有电影感的短视频片段。它代表了当前文本到视频生成技术的前沿水平,在视频分辨率、
Veo 2是谷歌DeepMind开发的最新、最先进的视频生成人工智能模型,能够根据文本、图像或视频提示,生成高质量、长达一分钟以上、具有电影级视觉效果的连贯视频。它在视频质量、运动控制、时间一
Veo 2.0是谷歌DeepMind开发的最新视频生成人工智能模型,能够根据文本提示、图像或视频片段,生成长达一分钟的1080p高清、电影级画质、连贯且富有创意的视频内容。它在视频质量、运动控
Stable Diffusion XL(SDXL)是Stability AI开发的最新文本到图像生成模型,相比前代在图像质量、分辨率、细节表现和提示词理解上均有显著提升。它支持1024x102
Stability AI SDXL Turbo 是一款基于对抗扩散蒸馏技术的高性能文本到图像生成模型,能够在单步推理中生成高质量图像,速度比传统模型快数倍,适用于实时创意设计和快速原型开发。
Stability AI SDXL(Stable Diffusion XL)是Stability AI推出的最新一代文本到图像生成模型,相比前代Stable Diffusion,在图像分辨率、
Stable Diffusion XL(SDXL)是Stability AI开发的最新开源文本到图像生成模型,相比前代在图像质量、分辨率和语义理解上实现显著提升。本页面全面介绍SDXL的核心特
Sora是OpenAI开发的一款先进的文本到视频生成模型,能够根据用户输入的简短文本描述,生成高质量、连贯且富有细节的短视频片段。它代表了扩散模型和Transformer架构在视频生成领域的重
Stable Diffusion 3 是 Stability AI 推出的最新文本到图像生成模型,采用创新的扩散变换器架构,在图像质量、文字渲染和复杂场景理解方面实现重大突破,支持多模态输入和
Stability AI SD3是Stability AI推出的最新一代开源文本到图像生成模型,基于扩散变换器架构,支持多模态输入、高分辨率输出和精准的文本渲染,适用于创意设计、内容生成和商业
Stable Diffusion 3.5是Stability AI发布的最新版本AI图像生成模型,相较于前代在图像质量、文本理解、生成速度和多样性上实现了显著提升。本文详细介绍其核心特性、技术
Stable Diffusion 3.5 是 Stability AI 发布的最新版本文本到图像生成模型,基于扩散技术,提供更高质量的图像生成、更精准的文本理解以及灵活的定制能力。支持多种分辨
Adobe Firefly Image 3是Adobe公司推出的第三代AI图像生成模型,集成于Creative Cloud生态系统,专注于生成高质量、商业安全的图像内容,支持自然语言描述生成、
Stable Diffusion XL(SDXL)是Stability AI推出的先进开源文本到图像生成模型,以其卓越的图像质量、丰富的细节表现和强大的构图能力,成为AI图像生成领域的标杆工具
Runway Gen-9是Runway公司推出的最新一代人工智能视频生成模型,它代表了当前AI驱动创意工具的最高水平之一。该模型专注于从文本、图像或视频输入生成高质量、连贯且富有创意的视频内容
Runway Gen-3是Runway公司推出的最新一代人工智能视频生成模型,代表了当前AI视频生成技术的顶尖水平。它能够根据文本描述、图像输入或简单草图,快速生成高质量、连贯且富有创意的视频
Stable Diffusion 3是由Stability AI开发的最新文本到图像生成模型,通过改进的架构和训练方法,显著提升了图像质量、文本理解能力和生成细节的精确度。
DALL-E 3是OpenAI开发的第三代文本到图像生成模型,能够根据详细的自然语言描述生成高度准确、富有创意且细节丰富的图像。该模型在理解复杂提示、处理空间关系和生成连贯视觉内容方面实现了显
OpenAI Sora 是 OpenAI 推出的最新 AI 视频生成模型,能够根据文本描述直接生成长达60秒的高质量、连贯且富有创意的视频。它融合了深度学习和扩散模型技术,支持多镜头切换、复杂
Kling AI 2.5是快手旗下AI团队推出的最新视频生成模型,基于扩散变换器架构,支持从文本或图像生成高质量、高一致性、高动态性的视频内容。本文详细介绍其核心功能、技术特点、使用场景及操作
Midjourney 6是Midjourney公司推出的最新版本AI图像生成模型,基于先进的深度学习技术,能够根据文本描述生成高质量、高细节、风格多样的图像。本文详细介绍其核心功能、技术原理、
DALL·E 4是OpenAI推出的最新AI图像生成模型,基于深度学习技术,能够根据自然语言描述生成高质量、高分辨率的图像。相比前代,DALL·E 4在图像细节、风格多样性、语义理解准确性和生
Midjourney 6是Midjourney公司推出的第六代AI图像生成模型,以其卓越的图像质量、精准的提示词理解、丰富的风格控制和高效的生成速度,成为设计师、艺术家和创意工作者的首选工具。
Ideogram 4.0是Ideogram公司推出的最新AI图像生成模型,在文字渲染、图像逼真度、色彩表现和构图能力上实现了重大突破。该模型支持从简单提示词生成高质量图像,尤其擅长在图像中嵌入
Ideogram 2.5是Ideogram公司最新推出的AI图像生成模型,凭借其卓越的文本渲染能力、逼真的图像质量和强大的风格控制,成为设计师、营销人员和创意工作者的首选工具。该版本在图像细节
Stable Diffusion 4是Stability AI推出的最新版本AI图像生成模型,基于扩散技术,能够从文本描述生成高质量、高分辨率的图像。本文详细介绍其核心功能、技术优势、应用场景
DALL-E 4是OpenAI推出的最新AI图像生成模型,基于深度学习技术,能够根据文本描述生成高质量、高细节的图像。它支持多轮编辑、风格迁移、图像修复等功能,广泛应用于创意设计、广告营销、内
Runway Gen-3是Runway公司推出的最新一代AI视频生成模型,基于扩散Transformer架构,能够从文本、图像或视频片段生成高质量、连贯且富有创意的视频内容。它支持多种风格、实
Suno V5 Alpha 是 Suno 推出的最新一代 AI 音乐生成模型,基于深度学习技术,能够根据文本描述、歌词或旋律片段自动生成高质量、风格多样的音乐作品。该工具支持多种音乐流派、人声
Runway Gen-3 Alpha是Runway公司推出的第三代AI视频生成模型,专注于从文本、图像或视频片段快速生成高质量、逼真的视频内容。它采用先进的扩散模型架构,支持高分辨率输出、精细
OpenAI Sora 是 OpenAI 推出的最新 AI 视频生成模型,能够根据文本描述直接生成高质量、连贯且富有创意的视频内容。它利用先进的深度学习技术,理解自然语言指令并转化为动态视觉场
DALL-E 3是OpenAI推出的最新一代文本到图像生成模型,能够根据自然语言描述生成高质量、高细节的图像。相比前代,DALL-E 3在理解复杂提示、图像保真度和创意表现上实现巨大飞跃,并深
Sora是OpenAI开发的一款突破性文本到视频生成模型,能够根据用户输入的简短文字描述,生成长达一分钟的高质量、高保真视频内容。它代表了当前AI视频生成领域的最先进技术,能够理解复杂的物理世
Runway Gen-3 0是Runway公司推出的最新一代多模态人工智能模型,专注于高质量、高可控性的视频生成与编辑。它代表了从文本、图像到视频内容创作范式的重大飞跃,旨在为创意工作者提供前
Stable Video Diffusion是由Stability AI开发的开源视频生成扩散模型,能够根据文本描述或静态图像生成高质量、连贯的短视频片段,是AI视频生成领域的重要开源工具。
DALL-E 3是OpenAI推出的第三代AI图像生成模型,能够根据用户提供的文本描述,生成高度逼真、细节丰富且创意十足的图像。它基于深度学习技术,理解自然语言中的复杂概念和关系,支持多种风格
Replicate CogVideo是由清华大学和智源研究院联合开发的先进文本到视频生成模型,基于CogView2架构,能够根据文本描述自动生成高质量、连贯的短视频片段,是开源AI视频生成领域
Midjourney V18是Midjourney公司推出的最新一代人工智能图像生成模型,以其卓越的图像质量、对复杂提示词的理解能力、更精细的细节控制以及创新的风格一致性功能,重新定义了AI驱
Cohere Generate是Cohere公司推出的先进文本生成模型,专为企业级应用设计,能够根据简短的提示或指令,自动生成高质量、连贯且符合上下文的文本内容,广泛应用于内容创作、营销文案、
Civitai是一个专注于稳定扩散(Stable Diffusion)等开源AI图像生成模型的社区驱动型平台,为用户提供模型发现、下载、分享、评级及讨论的一站式服务,极大地推动了AI艺术创作的
GitHub Copilot Agent v14 是 GitHub 推出的最新版本 AI 编程助手,基于强大的代码生成模型,能够实时理解开发者意图,提供代码补全、函数生成、错误修复、文档编写等
Stable Video 4D 是 Stability AI 推出的前沿视频生成模型,能够从单一输入视频生成多视角、动态的4D内容,支持时间与空间维度的自由控制,为影视制作、游戏开发、虚拟现实
Kling AI 3.0是快手推出的最新AI视频生成模型,支持文本和图像生成高质量视频,具备高分辨率、长时长、物理模拟和电影级运镜等特性,广泛应用于内容创作、广告营销和教育培训等领域。
GitHub Copilot Agent v2 是 GitHub 推出的第二代 AI 编程助手,基于先进的自然语言处理和代码生成模型,能够实时理解开发者意图,提供代码补全、函数生成、错误修复和
Suno AI V5 是 Suno 公司推出的最新一代人工智能音乐生成模型,能够根据文本描述或简单旋律快速生成高质量、多风格的音乐作品。它支持自定义歌词、节奏、乐器编排,并具备实时协作功能,为
Copilot Microsoft v11 是微软推出的新一代人工智能编程助手,基于先进的自然语言处理和代码生成模型,能够帮助开发者快速编写、调试和优化代码。它集成在 Visual Studi
Stable Audio 3 是 Stability AI 推出的最新音频生成模型,能够根据文本描述或参考音频生成高质量、结构完整的音乐和音效。支持最长 3 分钟的立体声输出,具备音频到音频转
Stable Audio 2.0是Stability AI推出的最新版本AI音频生成模型,能够根据文本描述或音频参考生成高质量、多轨道的音乐和音效。支持长达3分钟的完整曲目创作,提供风格控制、
ElevenLabs Prime Voice 2是ElevenLabs推出的第二代AI语音合成模型,支持多语言、多情感、高保真度的文本转语音,适用于有声书、播客、视频配音、虚拟助手等场景。其核
Sora AI是OpenAI推出的创新文本转视频生成模型,能够根据文字描述生成逼真且富有创意的视频内容。本文详细介绍Sora AI的核心功能、技术原理、应用场景及使用指南,帮助用户快速掌握这一
Suno V3.5是Suno AI推出的最新版本AI音乐生成模型,能够根据文本提示快速生成包含人声、旋律、和声和节奏的高质量完整歌曲。它支持多种音乐风格,提供免费和付费方案,适合音乐创作者、内
DALL·E 5是OpenAI推出的最新版本AI图像生成模型,基于先进的深度学习技术,能够从文本描述中生成高质量、高细节的图像。它支持多种风格、复杂场景和精确控制,广泛应用于创意设计、广告、教