数据科学是在软件行业越来越多的话题,和机器学习是在技术领域的最前沿,也有新的应用程序,使工作更容易和更快每天都在发展。
随着这种令人兴奋的增长,我们不断涌入新的创造者,科学家和分析家,加入终身学习行列。
5.WSL
第一个工具是Windows用户专用的,它是最大化Windows内部工作流的好方法。对于那些不熟悉此概念的人,Windows没有传统的bash终端,因为操作系统的编程方式与基于Unix的系统完全不同。这可能会严重损害普通开发人员的工作流程,数据科学家的情况也是如此。
但是,WSL允许您在Microsoft Windows内运行虚拟Linux终端,通常是Ubuntu。通常,Windows上的套件需要不断地切换应用程序,Git-Bash、Anaconda Prompt等。当然,采用这种方法没有错,但是WSL使整个集成变得更加容易,并且允许增强了工作流程,尤其是在与团队合作时。
4.数据库浏览器
很多人可能没有听说过DB-Browser。 DB-Browser允许您查看数据库的内部以及熟悉其架构而无需发送单个查询。当我有一些神秘的DB时,我经常使用DB-Browser,或者想要测试一些查询以确保其在推送代码之前能够正确执行我想要的操作。DB-Browser还可以在Windows、Linux和Mac上普遍使用,这使其成为任何人都可以使用的出色免费工具。
3.R Studio
如果您是杰出的R程序员,或者更喜欢Python、Scala、MATLAB或Julia,但是经常使用R,则R Studio无疑是值得研究的数据科学工具。R studio唯一的重要缺点是它不便宜,而且肯定不是免费的。无论价格还是使用情况,R studio绝对是一个很酷的工作环境,我可以在其中享受很多工作。
2.Docker
Docker是您可能想到的另一个,但没有出现在该列表中,Docker当然并非总是所有事物的最佳选择。但是,作为喜欢Dev-ops和Linux的人,Docker是设置虚拟环境以完成工作的好工具。我们不仅拥有Python软件包索引之类的语言软件包管理器的优势,而且还具有Linux软件包管理器的优势。
尽管肯定有这些好处,但是对于大多数人来说,仅使用Pip /virtual env可能是一个更好的主意。这些工具对于快速设置,跟踪pip wheel和部署绝对有用。使用这两种方法都有缺点和优点,但就我而言,我建议使用Docker。
1.Jupyter
当然,Jupyter可能不需要介绍,但它成为我列表的第一名,因为如果没有它就没有任何意义。Jupyter允许您在逐个执行虚拟内核的虚拟内核中利用Conda虚拟环境。这只是数据科学的必要条件,但是您当然已经知道了。
还需要注意的是Jupyter是跨平台的,可以在任何地方使用。Jupyter还支持可允许执行任何语言的扩展,使其成为除Python之外还可以与R、Scala、Julia和C一起使用的工具。我无法告诉您每天尝试进入Jupyter调试或测试功能的次数。快速简便的设置也是一个加号。
👍
楼主残忍的关闭了评论