2022年AI领域的发展可谓「突飞猛进」,先后出现了图像生成 (Stable Diffusion、DALL·E 2) 和文本生成 (ChatGPT) 两个王炸。 2023年AI进展则集中在技术完善与落地应用方面,更像是通往 AGI 的过渡阶段。
2023年AI关键进展
AI图像生成
- Adobe Firefly:Adobe Firefly 和 Generative Fill 技术增强了视觉内容的多样性
- Midjourney:Midjourney V.5 模型在图像生成的效率和分辨率上有所提升,V.6 版本则进一步增强了这些特性
- DALL·E 3:基于 ChatGPT DALL·E 3简化了图像生成过程,减少了复杂提示词的需求
- Shutterstock.AI:Shutterstock 集成了AI能力,允许用户将提示转化为可授权的图像
AI视频生成
- Stability AI:推出了开源 Stable Video Diffusion 模型,有望在视频生成领域发挥重要作用
- HeyGen:展示了用于视频的语音克隆、唇部运动调整和语言翻译的工具
- Runway Gen-2:用户可以通过文本提示、图像或其他视频轻松生成视频
- Pika 和 Pika 1.0:Pika 的初始版本吸引了大量用户,并在 Pika 1.0 中增加了多种风格的视频编辑能力
- Meta Codec avatars:Meta Pixel Codec Avatars (PiCA) 模型为视频中的3D人脸提供了更逼真的远程存在体验
AI文本生成
- Bard 和 Gemini:谷歌 Bard 和 Gemini 提升了聊天机器人的情感表达能力,Gemini 在多模态数据集上训练,成为 OpenAI ChatGPT 的有力竞争者
- Grok:Elon Musk 的 xAI 推出 Grok,一个具有幽默感和实时知识更新能力的聊天机器人
- OverflowAI:Stack Overflow 的 OverflowAI 通过AI驱动搜索提升知识策划
- Llama 2:Meta Llama 2是下一代开源大型语言模型,优化了对话用例
- GPT-4:OpenAI GPT-4 处理图像输入,支持实时网络浏览,扩展了插件支持
- Mistral 7B:Mistral AI 发布挑战 GPT-4 的 Mistral 7B 大型语言模型
- Mixtral 8x7B:Mistral AI 推出高质量稀疏混合物的 Mixtral 8x7B,强调模型开放性
- Yi-34B llm:01.AI 发布开源神经网络 Yi-34B,性能优于参数计数更高的模型
AI的其他进步
- SAM:Meta AI 的 SAM 模型展示了无需额外训练的对象分割能力
- DPO:DPO (Direct Preference Optimization) 方法用于微调大型无监督语言模型和文本到图像模型
- Zephyr Direct Distillation of LM Alignment:Zephyr-7B 通过直接偏好优化 (dDPO) 提升了聊天模型的意图对齐
- 自主AI智能体:自主AI代理展示了向高级自主AI系统的转变
- EvoDiff:微软的 EvoDiff 开源框架用于快速且经济的蛋白质生成
- Stable Audio:Stability AI 的工具能从文本提示生成高质量音频剪辑
- GPT Store, Copyright Shield, ChatGPT Bot Constructor:OpenAI 推出 GPT Store、Copyright Shield 和 ChatGPT Bot Constructor 等产品
- Stability AI开源其LLM:Stability AI开源了其模型,包括 Stable Vicuna,首个使用人类反馈强化学习训练的聊天机器人
2023年AI领域的顶级合并
- Stability AI 与 Init ML:Stability AI收购Init ML,整合先进技术到 ClipDrop 生态系统,开发 SDXL Turbo
- Runway 与 Getty Images:合作推出视频生成模型 RGM,结合 Runway 的AI能力和 Getty Images 的内容库,改变内容创作流程
- Snowflake 与 Neeva:Snowflake 收购 Neeva,后者以生成AI增强搜索体验著称,但关闭了订阅搜索引擎
- Shutterstock 与 OpenAI:延长合作伙伴关系,OpenAI 利用 Shutterstock 数据丰富模型训练,Shutterstock 推出AI图像生成工具
2023年最重要的法律事件
- 欧洲AI法案:欧盟推出全球首部全面AI法规,按风险分类AI系统,实施延迟至2025年
- 美国版权局立场:拒绝为AI算法 Midjourney 创建的图像注册版权,确立先例;AI辅助作品可能获得版权保护
2023年引人注意的大讨论
- 企业对 ChatGPT 限制:多家金融机构因安全隐私问题限制 ChatGPT 使用,反映企业对AI应用的法律考虑
- OpenAI低薪工人问题:时代杂志揭露 OpenAI 与 Sama 合作,引发工人待遇和内容审核心理健康影响的伦理问题
- OpenAI领导层变动:Sam Altman 离职后迅速回归,引发关于变动原因和未来影响的广泛关注
- Adobe 与 Figma收购案:Adobe 计划收购 Figma 遇监管障碍,最终因反垄断挑战放弃交易,支付 Figma 10 亿美元终止费
- 摄影师黑客攻击世界摄影奖:Boris Eldagsen 提交AI生成作品参赛,引发关于AI图像在摄影比赛中地位的辩论