分类数据科学下的文章

计算机先知的诚若所思

计算机科学在商业上的应用蓬勃发展，掩盖了其在大众眼中竞争情报上重要历史和现实意义。恰好接触到一篇Vannevar Bush于1945年7月发表于大西洋月刊（The Atlantic Monthly）的文章《As We May Think》（广泛翻译为诚若所思），关于信息的内容深刻的影响了情报学科。

856px-The_Memex_(3002477109).jpg

文章基于科学技术文献的爆炸式增长以及国家、社会、公众及科研本身对科技文献的大量个性化需求的背景，作者构想了 “memex”的概念，被视为当前数字图书馆的起源和雏形，提出了信息采集、信息存储以及信息检索的新方案，对后来信息系统的设计提供了参考，同时也为后来超链接产生提供模型。

阅读全文

2020-11-02 cds 0 条评论 1977 次浏览

数据科学

人工智能的7大关键技术

企业使用AI的一个复杂因素是，这个主题包含了多个不同的底层技术。这些技术中大多数都能够完成很多替代功能。技术和功能的组合非常复杂，表中列出了7项关键技术，包括每项技术的简要描述，以及它们可以实现的一些典型功能或应用程序。

本文摘编自《数字时代的企业AI优势：IT巨头的商业实践》，将简要介绍这个表中的每种技术及其功能。本文作者托马斯·H. 达文波特（Thomas H. Davenport）是巴布森学院（Babson College）的信息技术与管理教授，同时也是德勤战略和分析实践部门的高级顾问。

阅读全文

2020-10-18 cds 0 条评论 2009 次浏览

数据科学

Sharan 是一位数据科学专业人士，在高级分析和应用机器学习方面拥有十年的经验。他写了两本书。《掌握社交媒体挖掘》（Mastering Social Media Mining with R）是关于使用各种社交媒体API来获取数据并开发有趣的分析用例的，而《数据科学要领》（R Data Science Essentials）则是关于数据分析中必不可少的概念和技术的。How to Learn Data Science (A Step-by-Step Guide) 介绍学习数据科学的分步指南。

阅读全文

2020-10-12 cds 0 条评论 1907 次浏览

数据科学

生物信息分析的三大数据科学工具

Bioinformatics

生物信息学（Bioinformatics）是利用应用数学、信息学、统计学和计算机科学的方法研究生物学问题的学科。生物信息学的研究材料和结果就是各种各样的生物学数据，其研究工具是计算机，研究方法包括对生物学数据的搜索、处理及利用。当前主要的研究方向有：序列比对、序列组装、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测，以及创建进化模型。

阅读全文

2020-09-25 cds 0 条评论 4040 次浏览

数据科学

发表在 Nature 上的 NumPy 综述

2020年9月16日，Nature 发表了 NumPy 团队撰写的一篇综述文章《Array programming with NumPy》（使用NumPy进行数组编程），介绍 NumPy 的发展过程、主要特性和数组编程等。

阅读全文

2020-09-20 cds 0 条评论 1941 次浏览

数据科学

数据科学十大清单

Mojeed Abisiga, Data Scientist & Machine Learning Engineer的《The List of Top 10 Lists in Data Science》一文为您提供了数据科学家所需的关键信息，这样您就可以有效地利用时间，灵活地探索数据科学的职业道路，帮助您找到穿越数据科学迷宫的方法。

在这份列表中，作者多次提到Kaggle——Kaggle是一个数据建模和数据分析竞赛平台。企业和研究者可在其上发布数据，统计学者和数据挖掘专家可在其上进行竞赛以产生最好的模型。这一众包模式依赖于这一事实，即有众多策略可以用于解决几乎所有预测建模的问题，而研究者不可能在一开始就了解什么方法对于特定问题是最为有效的。各种公司或平台将需要解决的问题挂在Kaggle平台上，通过悬赏找出最佳方案。对那些研究数据分析、机器学习领域的人来说，Kaggle就是一场“华山论剑”。

阅读全文

2020-09-08 cds 0 条评论 1711 次浏览

数据科学