cds 发布的文章

David Donoho:数据科学 50 年


本文译自 David Donoho (2017): 50 Years of Data Science,发表在 Journal of Computational and Graphical Statistics 杂志。在正式发表前数年,其初版就广为流传,引发了学术界深入、持续的讨论。原文以 1962 年 Tukey 的著名文章 The Future of Data Analysis 作为数据科学元年,如此来算数据科学迄今已逾 60 年。故译本文以为纪念。 Donoho 是斯坦福大学统计系教授及人文与科学学院 Anne T. and Robert M. Bass 讲席教授。他在关于稀疏数据、小波分析、图像的稀疏表达、凸优化、压缩感知等领域的工作, 在统计、 数学、 电子工程等学科和产业界有着深远的影响。Donoho 是美国国家科学院院士、法国科学院外籍院士。他曾经获得过麦克阿瑟奖、约翰 · 冯 · 诺依曼讲座奖、邵逸夫奖等。

64f78ee1d49618f094e64111_vationventures_datascience.jpeg

本文译者:于嘉傲,审校:魏太云、邱怡轩,为了便于网页阅读,对表格、脚注进行了调整,并更新了失效的网页链接。原文链接:https://doi.org/10.1080/10618600.2017.1384734,统计之都中文译本:https://cosx.org/2023/03/50-years-of-data-science-cn/


AI特刊:Gemini Code Assist


Gemini Code Assist 是一个依托 AI 技术的协作工具,可提供指导,帮助您解决代码问题、为项目生成代码,以及在编码时接收内嵌建议。

2025-02-28-232835.jpg

Gemini Code Assist免费个人版全球上线,只需Google账号就可以使用。Gemini Code Assist使用Gemini 2.0模型为底层,又经过Google根据真实程式撰写情境微调及优化,支持所有主流编程语言,每月18万次代码补全,长达128K tokens适用大型档案,已经登录VS Code、JetBrains、Android Studio、Firebase……等主流开发工具。


人工智能健康助手OpenHealth的本地部署指南


本文简要介绍在Windows计算机以Docker方式本地部署人工智能应用OpenHealth的过程。

182871266.webp

OpenHealth是一个人工智能健康助手,通过本地运行的人工智能框架和个人健康信息运行。系统由解析和LLM两个主要组件组成。目前,解析使用Upstage和OpenAI API(在我们的测试中表现最佳),本地解析器即将推出。LLM组件可以使用Ollama在本地完全运行。


即将颠覆世界的六个年轻“志愿者”


六位未满25岁的科技天才是马斯克DOGE(政府效率部)的“六君子”(《每日邮报》称为“书呆子大军”)。他们手握AI、数据科学和自动化技术,意图用代码取代政客,用算法消灭低效,以科技之力撬动整个国家机器。

94835251-0-image-a-86_1738648179553.jpg

由于信奉(1)未来十年全球风险集中在环境、技术和社会治理(世界经济论坛《2024年全球风险报告》),和(2)全球治理转型、人工智能技术和特朗普新政加速旧国际秩序崩溃这两个理论和判断,转发本文以介绍人工智能、数据科学和自动化应用于社会治理。


DeepSeek


深度求索(DeepSeek)是由中国对冲基金幻方(High-Flyer)创立和支持的人工智能公司。2024年12月,该公司将其人工智能模型 DeepSeek-V3 版作为开源发布,声称该模型可与 OpenAI 和谷歌的模型相媲美,但训练成本仅为 560 万美元(尚不清楚具体包括哪些支出,但推测是该模型使用 2,048 个 NVIDIA H800 GPU 进行了约两个月预训练的 GPU 成本)。

ff6d4aae-33d6-4cdd-b861-d98e312a5452.jpg

DeepSeek在网页端、APP 和 API 全面上线,可以写代码、读文件、写作各种创意内容,该模型正受到越来越多的关注。在Vibe-Eval基准测试中是迄今为止排名最高的公开授权模型,也是目前最大的公开授权模型,比 Meta 公司最大的 Llama 系列模型 Llama 3.1 405B 还要大得多。


NVIDIA Project DIGITS个人AI超级计算机


2025 年 1 月 6 日,NVIDIA 推出了 NVIDIA® Project DIGITS,这是一款个人 AI 超级计算机,可让全球的 AI 研究人员、数据科学家和学生使用 NVIDIA Grace Blackwell 平台的强大功能。

NVIDIA Project DIGITS

Project DIGITS 采用全新的 NVIDIA GB10 Grace Blackwell 超级芯片,提供千万亿次的 AI 计算性能,可用于原型设计、微调和运行大型 AI 模型。