加入收藏 | 设为首页 | 会员中心 | 我要投稿 吉安站长网 (https://www.0796zz.com.cn/)- 科技、图像处理、媒体智能、办公协同、操作系统!
当前位置: 首页 > 站长资讯 > 传媒 > 正文

生产服务器变慢了,你能谈谈诊断思路吗

发布时间:2021-02-17 11:46:08 所属栏目:传媒 来源:互联网
导读:在Kaggle上,人们可以分享想法,获得启发,同其他数据科学家展开竞争,学习新事物和编程技巧,观察诸多真实数据科学应用的实例。这里有许多能应用于多种场合的数据集,或简单如电子游戏销售,或庞杂重要如空气污染数据。 这些数据取自现实世界,几经引用参考

在Kaggle上,人们可以分享想法,获得启发,同其他数据科学家展开竞争,学习新事物和编程技巧,观察诸多真实数据科学应用的实例。这里有许多能应用于多种场合的数据集,或简单如电子游戏销售,或庞杂重要如空气污染数据。

这些数据取自现实世界,几经引用参考,可用来训练并评测那些真正对人有帮助的项目模型。Kaggle另有许多实用的特色功能,比如数据、代码、社区、灵感、竞赛和课程等。

优势

Kaggle有许多优势,这些都是你应当使用Kaggle的原因。

1.数据

Kaggle上有一些可用的数据集。大多数数据集的文件格式是CSV,JSON、SQLite、archives和BigQuery格式的数据集不太普遍,但依旧用途颇广。练习使用多种文件格式有所助益,你在工作中有可能遇到这些文件格式。下面是三个目前最热门的数据集。

  • COVID-19开放研究数据集挑战赛
  • UNCOVER COVID-19挑战赛
  • ProZorro.乌克兰公共采购数据集

2.代码

Kaggle上有大量代码。如果你想查看其他Kaggle用户的不计其数的代码,在Notebooks上进行检索很方便,其中包括代码以及大多数用户对代码的注释。这能帮助我们学习和练习,并借鉴他人处理类似问题的方式。大多数人使用Python进行编程,但也不乏一些人采用包括R、SQLite和Julia在内的其他编程语言。

代码通常是记事本(又称为Jupyter Notebook)形式,保存在后缀为.ipynb的文件中。有一些展示了端到端机器学习模型的例子,其中一些包括数据提取与清洗、探索性数据分析、特征工程、基础模型创建、最终机器学习模型实现、以及结果的输出和解释。

大多数数据科学家在工作中经常用到这些步骤,因为这对于其他数据科学家和相关工作者来说,都是简便且易于遵循的流程。

  • code languages supported on Kaggle: Python, R, SQLite, and Julia

3.社区

与Medium、GitHub、Stack Overflow和LinkedIn类似,Kaggle作为一个社区,数据分析师、数据科学家和机器学习工程师可以在其中学习、成长和互动。

你可将自己的工作(如数据,代码和记事本文件)发布在其上和他人分享,以发展自己的社区。作为社区的成员有其独到的优势,所以笔者强烈建议以Kaggle作为起点,培养自己的社区,并与其他社区建立联系。

4.灵感

通过这里的数据、代码、社区、课程和竞赛,你可以收获绝妙的灵感。观看别人参与到对他人和企业有助益的比赛之中,欣赏其精彩发挥,这着实激励人心。

如果你正在思索下一步该学习什么,亦或是如何实现某一功能,也许应该看一看别人如何实现某一模块,例如以特定方式实现随机森林。你可以在Kaggle上找到这些,最终激励自己更上一层楼。



(编辑:吉安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读