2019 年关于数据科学、机器学习和人工智能的五大预测


每年的这个时候,我们都会回顾过去,展望未来。对于数据科学、机器学习和人工智能来说,则是看看什么趋势会加快、什么事情会真正发生、什么事情在未来一年不会发生。

predictions.png

我们一整年都在观察和报道这些趋势,并且我们搜索了网络,咨询了我们的一些专家以了解其他人的想法。


商业智能(Business Intelligence, BI)


商业智能(Business Intelligence, BI),又称商业智能或商务智能,指用现代数据仓库技术、在线分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。

Business-Intelligence.jpg

商业智能的概念经由Howard Dresner(1989年)的通俗化而被人们广泛了解。当时将商业智能定义为一类由数据仓库(或信息市集)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。


Power BI 知识框架(Excel、Power BI、Power Query、Power Pivot、M语言、DAX语言)


Power BI是Microsoft的业务分析服务。它的目的是提供交互式可视化和商业智能功能,其界面应足够简单,以使最终用户可以创建自己的报告和仪表板。使用Microsoft Power BI 数据可视化工具将数据转变成机遇。通过分析企业数据获得见解,提高企业的决策水平。

1_NIyBHIp_iHaok5BmzCkSOA.jpeg

随着数据分析工具的不断更新,我们所熟知的Excel可能已经不是你想象中的样子了。Excel和Power BI又有何千丝万缕的联系?M语言和DAX语言又是什么样的存在?操作他们又需要掌握什么样的技能?通过我的讲解,从此你将发现一扇通往新世界的大门,开启你新的人生,让我们启航吧!


数据分析5大软件Excel、SAS、R、SPSS、Python优势分析


工欲善其事,必先利其器。说起来道理大家都懂,只是到了要学习的时候就开始各种退缩。殊不知一款好的数据分析工具可以让你事半功倍,瞬间提高学习工作效率。

data-analysis-tools.png

虽然数据分析的工具千万种,综合起来万变不离其宗。无非是数据获取、数据存储、数据管理、数据计算、数据分析、数据展示等几个方面。而SAS、R、SPSS、python、excel是被提到频率最高的数据分析工具。那么,这些工具本身到底有什么特点呢?


前所未有的机器学习简明释义


你可能听说过机器学习和人工智能,但你确定你知道它们是什么吗? 如果你在努力理解它们,那么你并不会孤军作战。有很多的噪声使人们难以分辨什么是科学,什么是科幻。所以让我们先从名字说起…

机器学习本质上就是贴标签。

我是一名训练有素的统计学家和神经学家,我们统计学家以为事物选择最枯燥、最乏味命名而著称。我们希望这些命名的标签能做到名副其实。你知道我们如何称呼机器学习吗? 就是给事物贴标签!

与流行的观点相反,机器学习并不是个魔盒,也不是300亿美元风投的原因。在本质上,机器学习只给事物打标签,它记录了你对某件事的描述,并告诉你它应该被贴上什么标签。这听起来远没有你在骇客新闻上看到的有趣。但是,如果我们把这个它称为“贴标签”,你还会高高兴兴的来阅读这一主题吗? 很可能不会,这说明了一点,市场营销和炫酷对让技术获得关注是很有用的(尽管不是你可能认为的原因)。

它非常有用,但不像听起来那么科幻。

那么什么是人工智能(AI)呢? 当学者们争论人工智能到底是什么和不是什么的时候,工业界正用这个词来指代一种特殊的机器学习类型。事实上,大多数时候人们只是交替使用它们,这我可以接受。这么说吧,人工智能也与标签有关。你在期待(AI)是机器人吗? 某种科幻式的意志,或是类人的存在? 今天的人工智能并非那个样子。但人类是一个在任何事物中都能看到人类特征的物种。我们看到吐司中的脸,云雾中的身体,如果我把两个扣子缝在袜子上,我甚至可能还会跟它说话。虽然袜偶并不是人,也不是人工智能 — — 记住这一点很重要。是不是很失望? 快振作起来! 事实上它要远远比这些有价值得多。

我来跟你说说为什么你应该振作吧。你在照片中看到了什么?

0_-jjqcGP6Qg2Y7Azg.png
这是什么动物? 很容易,对不对? 现在告诉我你的大脑是如何调用这些像素找到的答案。

你的感官摄取了一些非常复杂的数据,然后就好像魔法一样,你给它贴上了“猫”的标签。“这对你来说太容易了!” 如果我们想让电脑做同样的工作,把照片归类为“是猫”/“不是猫”,会怎么样呢?

机器学习是一种新的编程范式,一种将你的愿望传达给计算机的全新方式。

在传统的编程方法中,程序员会认真考虑像素和标签,与宇宙进行交流,沟通灵感,最后手工制作模型。模型只是这个秘方的一种花哨表述,或者是你的计算机必须遵循的一套将像素变成标签的指令。

0_3NxHB0DMwlWz0IdU.jpg
模型是计算机用来将数据转换成标签的方法。它只是机器用来将输入转换成输出的一些代码,可以由程序员手工编写,也可以通过算法从数据中学习。

但是想想这些指令是什么。你在用这些像素做什么? 你能说清楚吗? 你的大脑曾受益于无数次的进化,而现在它只是运行并生效了,你甚至不知道它是如何工作的。很难创造出这个秘方。

用案例而非指令说话

如果你能对电脑说,“看一堆猫的例子,看看一堆不是猫的例子,然后自己去弄清楚,岂不更好?” 这就是机器学习的本质。这是一个完全不同的编程范式。现在,你不用给出明确的指令,而是用例子来编程,机器学习算法在你的数据中找到模式并把它们变成那些你自己写不出来的指令。所以不要再手工制作什么秘方了!

人工智能允许你将难以描述的东西自动化。

为什么这会让人兴奋呢? 这是用一种我们向计算机传达愿望的前所未有的方式。我们喜欢让电脑为我们做事。但是,如果指令真的很难想出,我们怎么可能给出指令呢? 如果他们难以描述呢?

人工智能和机器学习就是让难以描述的事情自动化。他们是用例证来解释自己,而不是用指令。这解锁了在过去由于我们不能表达指令而无法让计算机来帮助我们的海量任务。现在执行这些任务都成为了可能 — — 机器学习代表了人类进步的一个本质性的飞跃。这是未来,未来在这里!

w_C-MDcW.jpg
Cassie Kozyrkov(twitter.com/quaesita
Head of Decision Intelligence, Google.