AI特刊:Android XR

人工智能 2024-12-16 102 次浏览 0 条评论 次点赞

bb69d8e7-1dae-4c9d-8ce5-e67d46e71e52.jpg

2024 年 12 月 12 日,Google 发布了面向 XR 生态的全新操作系统——Android XR,这个“为下一代计算而构建的全新操作系统”借助 XR 与 AI 能力给用户打造全新的体验。

d0ae237afb9c1fee6d4d0e180941e9d2.jpg

Android XR 是谷歌与高通和三星合作开发的,融合了多年来在 AI、AR 和 VR 方面的投资,为耳机和眼镜带来了有益的体验。首款 Android XR 设备是三星的一款耳机,搭载骁龙® XR2+ Gen 2 平台。


OpenAI shipmas


11fe9d8d-607b-49fb-9f4d-ef4e42cccc5d.jpg

OpenAI 从 12 月 5 日开始为期 12 天的“shipmas”圣诞式公告,每天都发布或演示一些新产品或新功能。

第 1 天:发布最新推理模型 OpenAI o1 和 ChatGPT 的新版本 ChatGPT Pro
第 2 天:允许用户根据自己的数据集对 o1 进行微调。
第 3 天:Sora:在 DALL-E 和 GPT 模型的基础上进行构建的文生视频模型。
第 4 天:Canvas,可用于与 ChatGPT 合作编写和编码项目。
第 5 天:Apple Intelligence 中的 ChatGPT 集成。
第 6 天:带有视频和圣诞老人​​模式的高级语音,两个新功能:高级视频对话和屏幕共享。
第 7 天:ChatGPT 中的项目:Projects。
第 8 天:ChatGPT Search开放。
第 9 天:OpenAI o1 模型和面向开发人员的新工具。
第 10 天:1-800-CHATGPT,用户每月可以免费与ChatGPT通话 15 分钟,拨打1-800-CHATGPT(即1-800-242-8478)或者通过 WhatsApp 向 1-800-242-8478 发送短信来开始对话。
第 11 天:使用桌面应用程序。
第 12 天:o3 预览和征求安全测试。


Google发布Gemini 2.0


blog_gemini_keyword_header.width-1200.format-webp.webp

2024 年 12 月 11 日Google发布了新一代人工智能模型Gemini 2.0,定位面向代理时代的全新 AI 模型。Gemini 2.0具有新功能,例如具有原生图像生成和音频输出的多模式输出,以及原生使用 Google 搜索和地图等工具。

Gemini和ChatGPT、Claude是目前热度最高的人工智能大模型,可以通过Google AI Studio使用Gemini 2.0的实验预览版发布,通过https://gemini.google.com/可以快速体验,以及快速从1.5 Flash切换到2.0 Flash Experimental。

在Google更改策略后,内置 Gemini(Gemini Nano)的 Pixel 手机包括Pixel 8系列(Pixel 8a、Pixel 8及Pixel 8 Pro)和Pixel 9系列(Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL及Pixel 9 Pro Fold),推荐使用。

使用方法:Google提供人工智能助手Google Gemini APP,可让在手机上直接访问 Google 的人工智能模型系列。

full.jpg

Google AI Studio 是基于浏览器的 IDE,专为使用 Gemini 进行构建而设计。利用 Google AI Studio,可以快速尝试各种模型,使用不同的提示进行试验,还允许通过 Gemini API 将您的项目导出到代码中。

这一次,定位精明技术业内人士首选聊天机器人的Claude没有跟进新版发布,仍旧维持在夏天发布的Claude 3.5 Sonnet。

Veo 2 & Imagen 3

960x0.webp

2024 年 12 月 16 日,宣布推出视频生成模型 Veo 的最新版本 Veo 2 和最新的图像生成模型 Imagen 3,谷歌于 5 月份在谷歌 I/O 开发者大会上首次宣布推出 Veo 和 Imagen 3。现在,通过Google Cloud提供的AI云托管平台Vertex AI,即可以体验Veo 2 和 Imagen 3。

使用方法Veo 2游乐场,登录用户送够一次基本体验的积分(5个积分);Imagen 3游乐场,登录用户送3个积分,够三次基本体验。

aafdf8d2-52aa-4b5a-bcc3-6bcd4681d812.jpg

上面是价值5个积分的Veo 2生成视频和价值1个积分的Imagen 3生成图片,使用相同的中文Prompt,Imagen 3没有完全理解。

普遍认为,上述发布是Google DeepMind直面OpenAI竞争发起的强力挑战,特别是民间传言:Veo 2一发布,Sora就输了。


Andrew Ng aisuite


GdPleo3bUAEr9AN.jpg

Andrew Ng 宣布发布一个开源 Python 包:aisuite,这款创新工具允许使用简单的“provider:model”字符串在模型之间无缝切换,使开发人员能够通过标准化接口轻松使用多个 LLM。目前支持的提供商有OpenAI、Anthropic、Azure、Google、AWS、Groq、Mistral、HuggingFace 和 Ollama。

AnalyticsVidhya已经有一份aisuite的实践材料


NVIDIA Chat with RTX


Chat with RTX是英伟达于2024年初发布的演示应用,适用于 Windows PC ,由 TensorRT-LLM 提供支持,可让用户个性化连接到自己的内容(文档、笔记或其他数据)构建个人知识库。

Forget-ChatGPT-Nvidia-dropped-Chat-with-RTX-and-its-FREE.jpg.webp

Chat with RTX 被设计为一个本地化系统,用户无需上网便可使用,所有具有至少 8 GB 显存的 GeForce RTX 30 和 40 GPU 都支持该应用程序。

👍

本文由 cds 整理发布,参考 CC-BY-SA 3.0 协议共享,欢迎转载、引用或改编。
感谢您的支持,以共同推动STEM公益教育!

楼主残忍的关闭了评论