2023年AI总结

2022年AI领域的发展可谓「突飞猛进」,先后出现了图像生成 (Stable Diffusion、DALL·E 2) 和文本生成 (ChatGPT) 两个王炸。 2023年AI进展则集中在技术完善与落地应用方面,更像是通往 AGI 的过渡阶段。

2023年AI关键进展

AI图像生成

  • Adobe Firefly:Adobe Firefly 和 Generative Fill 技术增强了视觉内容的多样性
  • Midjourney:Midjourney V.5 模型在图像生成的效率和分辨率上有所提升,V.6 版本则进一步增强了这些特性
  • DALL·E 3:基于 ChatGPT DALL·E 3简化了图像生成过程,减少了复杂提示词的需求
  • Shutterstock.AI:Shutterstock 集成了AI能力,允许用户将提示转化为可授权的图像

AI视频生成

  • Stability AI:推出了开源 Stable Video Diffusion 模型,有望在视频生成领域发挥重要作用
  • HeyGen:展示了用于视频的语音克隆、唇部运动调整和语言翻译的工具
  • Runway Gen-2:用户可以通过文本提示、图像或其他视频轻松生成视频
  • Pika 和 Pika 1.0:Pika 的初始版本吸引了大量用户,并在 Pika 1.0 中增加了多种风格的视频编辑能力
  • Meta Codec avatars:Meta Pixel Codec Avatars (PiCA) 模型为视频中的3D人脸提供了更逼真的远程存在体验

AI文本生成

  • Bard 和 Gemini:谷歌 Bard 和 Gemini 提升了聊天机器人的情感表达能力,Gemini 在多模态数据集上训练,成为 OpenAI ChatGPT 的有力竞争者
  • Grok:Elon Musk 的 xAI 推出 Grok,一个具有幽默感和实时知识更新能力的聊天机器人
  • OverflowAI:Stack Overflow 的 OverflowAI 通过AI驱动搜索提升知识策划
  • Llama 2:Meta Llama 2是下一代开源大型语言模型,优化了对话用例
  • GPT-4:OpenAI GPT-4 处理图像输入,支持实时网络浏览,扩展了插件支持
  • Mistral 7B:Mistral AI 发布挑战 GPT-4 的 Mistral 7B 大型语言模型
  • Mixtral 8x7B:Mistral AI 推出高质量稀疏混合物的 Mixtral 8x7B,强调模型开放性
  • Yi-34B llm:01.AI 发布开源神经网络 Yi-34B,性能优于参数计数更高的模型

AI的其他进步

  • SAM:Meta AI 的 SAM 模型展示了无需额外训练的对象分割能力
  • DPO:DPO (Direct Preference Optimization) 方法用于微调大型无监督语言模型和文本到图像模型
  • Zephyr Direct Distillation of LM Alignment:Zephyr-7B 通过直接偏好优化 (dDPO) 提升了聊天模型的意图对齐
  • 自主AI智能体:自主AI代理展示了向高级自主AI系统的转变
  • EvoDiff:微软的 EvoDiff 开源框架用于快速且经济的蛋白质生成
  • Stable Audio:Stability AI 的工具能从文本提示生成高质量音频剪辑
  • GPT Store, Copyright Shield, ChatGPT Bot Constructor:OpenAI 推出 GPT Store、Copyright Shield 和 ChatGPT Bot Constructor 等产品
  • Stability AI开源其LLM:Stability AI开源了其模型,包括 Stable Vicuna,首个使用人类反馈强化学习训练的聊天机器人

2023年AI领域的顶级合并

  • Stability AI 与 Init ML:Stability AI收购Init ML,整合先进技术到 ClipDrop 生态系统,开发 SDXL Turbo
  • Runway 与 Getty Images:合作推出视频生成模型 RGM,结合 Runway 的AI能力和 Getty Images 的内容库,改变内容创作流程
  • Snowflake 与 Neeva:Snowflake 收购 Neeva,后者以生成AI增强搜索体验著称,但关闭了订阅搜索引擎
  • Shutterstock 与 OpenAI:延长合作伙伴关系,OpenAI 利用 Shutterstock 数据丰富模型训练,Shutterstock 推出AI图像生成工具

2023年最重要的法律事件

  • 欧洲AI法案:欧盟推出全球首部全面AI法规,按风险分类AI系统,实施延迟至2025年
  • 美国版权局立场:拒绝为AI算法 Midjourney 创建的图像注册版权,确立先例;AI辅助作品可能获得版权保护

2023年引人注意的大讨论

  • 企业对 ChatGPT 限制:多家金融机构因安全隐私问题限制 ChatGPT 使用,反映企业对AI应用的法律考虑
  • OpenAI低薪工人问题:时代杂志揭露 OpenAI 与 Sama 合作,引发工人待遇和内容审核心理健康影响的伦理问题
  • OpenAI领导层变动:Sam Altman 离职后迅速回归,引发关于变动原因和未来影响的广泛关注
  • Adobe 与 Figma收购案:Adobe 计划收购 Figma 遇监管障碍,最终因反垄断挑战放弃交易,支付 Figma 10 亿美元终止费
  • 摄影师黑客攻击世界摄影奖:Boris Eldagsen 提交AI生成作品参赛,引发关于AI图像在摄影比赛中地位的辩论