5个优秀的Python端到端数据科学项目


本文是《5 Solved end-to-end Data Science Projects in Python》的节选,介绍 5 个优秀的数据科学项目,既有适合初学者的项目,也有高级项目,它们都是运用Python实现的,通过这些项目你可以充分了解数据科学对于企业的价值所在。

f02bad2626804e24ac742739440ea2a3.jpg


编程AI,让程序员提前下班、提早下岗


出于对强人工智能潜在风险的担忧,时任 Y Combinator 总裁 Sam altman 与特斯拉首席执行官埃隆·马斯克(Elon Musk)在 2015 年共同创建非营利性人工智能研究团体 OpenAI,目标在于建立一个全新的深度学习智能系统,包括在这些年已经被证明的在图像识别、口语辨识翻译等领域的具体应用。

GitHub-Copilot_blog-header.png

2019 年 7 月 22 日微软投资 OpenAI 10 亿美元,双方将携手合作替 Azure 云端平台服务开发人工智能技术。2020 年 6 月 11 日宣布了 GPT-3 语言模型,GPT-3 的目的是为了使用深度学习分类或产生人类可以理解的自然语言,微软于 2020 年 9 月 22 日取得独家授权。


谷歌用AI设计AI芯片


6月9日,谷歌在《自然》杂志(Nature)上发表论文《A graph placement methodology for fast chip design》表示,它的新人工智能可在不到6小时内完成人类需几个月才能完成的芯片设计工作。该技术已被用于开发最新一代的谷歌张量处理单元(TPU),用于运行人工智能相关任务,也就是用AI设计AI芯片。

1009px-Tensor_Processing_Unit_3.0.jpg

张量处理单元(Tensor Processing Unit,TPU),也称张量处理器,是 Google 开发的专用集成电路,专门用于加速机器学习。


Python 量化投资最简入门


量化投资就是利用计算机科技并采用一定的数学模型去实现投资理念、实现投资策略的过程。量化投资的优势在于提高了我们分析的广度和深度,通过历史回测获取概率优势,同时自动交易过程可以规避人性中的诸多弱点。随着大数据和人工智能的发展,量化投资将成为市场的主流投资工具,并且将与传统的基本面分析和技术分析深度结合。

maxresdefault.jpg

许多量化投资入门教程通常教授用 Python 通过爬虫从网络接口爬取股票数据,用 matplotlib 绘制 K 线和均线,基于 Numpy+Pandas+Matplotlib 进行数据分析,并用 sklearn 库的机器学习方法预测股票后市价格(如《基于股票大数据分析的Python入门实战》),但我们从 Python 使用现成数据源入手。以下主要介绍新浪财经的金融数据源,以及在 Python 中使用数据 API 和独立数据库的简要步骤。


深度学习的主流框架:TensorFlow和Pytorch


深度学习是 AI 和机器学习的一个分支,其使用多层人工神经网络精准完成物体检测、语音识别、语言翻译等任务。深度学习与传统机器学习技术的区别在于,前者可以自动从图像、视频或文本等数据中学习表征,无需引入手写代码规则或人类的领域知识。其高度灵活的架构可以直接从原始数据中学习,获得更多数据后,其预测准确度也将随之提升。AI 领域近期的许多突破创新都应归功于深度学习,例如 Google DeepMind 的 AlphaGo、自动驾驶汽车、智能语音助手等。(NVIDIA

deep-learning-evolution.png

主流的三大深度学习框架》一文简要介绍了TensorFlow、PyTorch 和 MXNet,不过,由于 TensorFlow 和Pytorch 占据了深度学习的半壁江山,本文再再综述一下。