Top 5 trang dự án open-source để học phân tích dữ liệu

học phân tích dữ liệu miễn phí

Hãy sử dụng các trang open-source dưới đây để tham khảo và nâng cao kỹ năng phân tích dữ liệu trong ngành khoa học dữ liệu.

Học khoa học dữ liệu không dễ dàng cho người mới bắt đầu và cả những người chuyên nghiệp. Ngành data science luôn cập nhật những kiến thức mới để bạn học mỗi ngày, nhưng nội dung học lại rộng. Nếu không có sự hướng dẫn thích hợp, nhiều người có thể lạc lối trong hành trình học tập. Đó là lý do tại sao nhiều người coi khoa học dữ liệu là ngành tuy hấp dẫn nhưng cực kỳ khó khăn để chuyển đổi.

May mắn thay, người học giờ đây đã có các dự án mã nguồn mở để tìm hiểu sâu hơn về khoa học dữ liệu. Những dự án này được viết ngắn gọn và sâu sắc mà mọi người có thể tìm hiểu kỹ lưỡng.

Bài viết này sẽ trình bày các dự án open-source khác nhau để học phân tích dữ liệu và  khoa học dữ liệu.

1. Virgilio

Virgilio được mệnh danh là nguồn tham khảo học liệu e-learning về khoa học dữ liệu. Virgilio cũng cố gắng cung cấp lộ trình học tập và các khái niệm gần gũi, dễ hiểu cho nhiều nhóm đối tượng một cách hệ thống để tránh bị nhầm lẫn trong quá trình nghiên cứu khoa học dữ liệu.

Việc học bắt đầu từ cấp độ Paradiso , nơi nội dung là tất cả về lý thuyết và lý do tại sao bạn nên học khoa học dữ liệu (hoàn toàn không viết code), ví dụ:

  • Học máy là gì và sự khác biệt giữa học máy và AI
  • Bạn có cần học máy không?
  • Các trường hợp sử dụng học máy
  • Chiến lược giảng dạy

Paradiso là khởi đầu hoàn hảo cho những người bắt đầu hành trình khoa học dữ liệu.

Từ cấp độ Paradiso, chúng ta chuyển sang cấp độ Purgatorio. Cấp độ này sẽ bao gồm các kiến ​​thức cơ bản của các nhà khoa học dữ liệu từ cơ bản đến hoạt động thực hành như:

  • Toán học và thống kê cơ bản
  • Lập trình cơ bản Python
  • Định nghĩa vấn đề
  • Khai thác dữ liệu
  • Đào tạo Máy học

Bạn sẽ học mọi thứ bạn cần để bắt đầu sự nghiệp trong lĩnh vực khoa học dữ liệu. Đừng lo lắng về cấu trúc vì Purgatorio cũng bắt đầu từ cách sử dụng cơ bản đến cơ bản hơn.

Cuối cùng, cấp độ nâng cao là cấp độ Inferno, trong đó phần này được dành cho người học cấp độ nâng cao. Phần này sẽ dạy cho bạn một ứng dụng cụ thể của khoa học dữ liệu:

  • Chuỗi thời gian
  • Máy tính Thị giác
  • Xử lý ngôn ngữ tự nhiên

Ngoài ra, cấp độ Inferno cung cấp tài liệu học tập cho các công cụ và thư viện khoa học dữ liệu cụ thể. Danh sách các kiến thức sẽ phát triển theo thời gian.

Dự án của Virgilio được phát triển bởi các nhóm cốt lõi khác nhau và những người đóng góp là các chuyên gia trong lĩnh vực này. Nếu bạn quan tâm, hãy cố gắng trò chuyện với nhóm discord của họ ở đây.

Khóa học bảo hành trọn đời dành cho người chuyển nghề!

Đầu ra của khóa học là Fullstack Data Scientist

2. MLCourse

MLCourse là một sáng kiến ​​dự án mã nguồn mở do Yury Kashnitsky từ OpenDataScience để tìm hiểu thêm về học máy, nơi người học có thể có sự cân bằng hoàn hảo giữa các kỹ năng lý thuyết và thực hành. Giống như tên gọi của nó, MLCourse là một dự án tổng hợp các khóa học mà chúng ta có thể theo dõi theo nhịp độ của bản thân.

Tuy nhiên, các khóa học này chỉ dành cho những người có kỹ năng khoa học dữ liệu cơ bản như Python và Toán học. Nhưng, điều đó không có nghĩa là người mới bắt đầu không thể thử học – sau cùng thì hướng dẫn của họ khá chi tiết.

MLCourse bao gồm mười chủ đề để mọi người tìm hiểu:

  1. EDA với Pandas
  2. Trực quan các phân tích dữ liệu
  3. Phân loại, Cây quyết định và K-NN
  4. Ordinary Least Squares và Linear Model 
  5. Bagging
  6. Kỹ thuật đóng gói tính năng và lựa chọn tính năng
  7. Phân tích không giám sát
  8. Tối ưu hóa
  9. chuỗi thời gian
  10. Gradient Boosting

Mỗi chủ đề đều có hướng dẫn dễ làm theo, sổ tay ví dụ , bài tập và khóa học video.

Nhược điểm của MLCourse là đã dừng cập nhật vào năm 2019 đối với ngôn ngữ tiếng Anh (Ngôn ngữ Nga được phục hồi vào năm 2022). 

3. ProjectLearn

ProjectLearn là một dự án mã nguồn mở cung cấp một danh sách các dự án hướng dẫn được tuyển chọn. Người tạo ra ProjectLearn hướng đến việc học ứng dụng thực hành nhiều hơn là lý thuyết, vì vậy bạn có thể mong đợi học một bộ kỹ năng cụ thể hơn là một bộ kỹ năng chung chung.

ProjectLearn không dành riêng cho khoa học dữ liệu vì bạn cũng có thể học cách phát triển web, thiết bị di động và trò chơi. Tuy nhiên, có một phần đặc biệt dành cho Học máy và AI.

Hầu hết dự án bao gồm một liên kết bên ngoài đến một bài báo hoặc video khác. Những dự án này đã được cập nhật cho những bạn muốn khám phá những gì bạn có thể làm với học máy.

4. Deepkapha

Deepkapha là một dự án mã nguồn mở đã tuyển chọn nhiều hướng dẫn về Trí tuệ nhân tạo và Học sâu để mọi người học hỏi từ đó. Khi tôi xem xét Deepkapha, tôi cảm thấy dự án này dành cho những người đã có kiến ​​thức cơ bản về khoa học dữ liệu và lập trình. Vì vậy, tốt hơn là bạn nên bổ sung kiến thức cơ bản trước khi khám phá Deepkapha khi bạn đã sẵn sàng.

Deepkapha tập trung vào Học sâu và các hướng dẫn khác nhau, điều này sẽ giúp bạn tìm hiểu khái niệm Học sâu và sự khác biệt giữa các khung. Tuy nhiên, bạn vẫn có thể khám phá nhiều tài liệu học tập, mặc dù chúng không cụ thể như vậy.

Một phần khác mà tôi thấy đặc biệt là bộ sưu tập blog Học sâu bao gồm nhiều nhà văn và blog khác nhau về học sâu. Bộ sưu tập hoàn chỉnh đến mức bạn có thể mất nhiều ngày để khám phá tất cả các blog.

5. Best of ML Python

Best of ML Python là một phần của dự án mã nguồn mở quản lý các gói và công cụ mã nguồn mở khác nhau được cập nhật hàng ngày. Trang dành riêng cho các dự án học máy mã nguồn mở được quản lý cho ngôn ngữ lập trình Python.

Loạt bài không đưa ra hướng dẫn cụ thể về cách thực hiện hoặc cách học các khái niệm cơ bản. Tuy nhiên, thay vào đó, họ đã phân loại tất cả các dự án Python tuyệt vời để chúng ta tìm hiểu.

Như bạn có thể thấy từ GIF ở trên, danh sách rất phong phú và được phân đoạn tùy thuộc vào những gì bạn cần. Hầu hết mọi thứ bạn cần để học một chủ đề cụ thể thông qua gói Python đều có sẵn vì vậy hãy cố gắng khám phá càng nhiều càng tốt.

Kết luận

Học khoa học dữ liệu không bao giờ là dễ dàng và có thể gây nhầm lẫn khi chúng ta không biết bắt đầu từ đâu. Đó là lý do tại sao trong bài viết này, tôi muốn trình bày dự án nguồn mở hàng đầu của tôi để tìm hiểu khoa học dữ liệu. Các dự án là:

  1. Virgilio
  2. MLCourse
  3. ProjectLearn
  4. Deepkapha
  5. Best-of ML Python

Tôi hy vọng nó sẽ hữu ích cho hành trình học tập của bạn!

Tham khảo bài viết: Top open-source projects to learn data science

Tác giả: Cornellius Yudha Wijaya

Biên dịch và biên tập: Mary

Bài viết có hữu ích không?

Các bài viết liên quan

flirt4free sito di incontri

Un arnese da dungeon di abile botta fetish

how to see who likes you on tinder review

ten. Allow her to generate have confidence in you

love ru sign in

18 Wedding Class Games Your guests Would like

militarycupid-recenze Seznamka

six. Sign-up online dating sites and you can qualities one to target rich website subscribers

Escort escort orlando

Do not get myself wrong; I'm an individual guy who's towards the matchmaking

adventure-dating-nl MOBIELE SITE

There is no better method to finish your day instead of sharing that it meme gif with your loved ones?

fastflirting Zaloguj si?

The working platform are right for small hookups

puerto-rico-chat-rooms dating

Ways to get an effective screenwriting broker and you can manager action six: choose wisely

sites-de-rencontre-mexicains avis

Paree list acquisition habitation 2021 — au Top 10+ demande a placer quand d’achat d’une logement

quickflirt kosten

Lass mich daruber erzahlen ruhen Eltern, entsprechend Die leser man sagt, sie seien, Jedoch befinden Die Kunden, entsprechend Eltern schuften

writers-dating dating

Amid all this, Ghanaian ladies are nonetheless thought to be beautiful and you will classic

hot or not Zaloguj si?

Mom Necklace, Mother-in-laws Necklace, On my Date’s Mommy Necklace, Current To possess Boyfriend’s Mom Mommy’s Time

girlsdateforfree mobile site

Relationships versus. Relationships: 15 Differences You have to know In the

dating-in-spanish mobile site

Think about, when you ask some body out, it's the start of exactly what will possibly feel a committed relationship

politische-dating-sites kosten

Lass mich daruber erzahlen genau so wie verknallen einander frauen

xpress-overzicht Dating

I've end up being rather used to this new constantly-overcrowded, feature-occupied graphics that many matchmaking platforms nowadays provides

Farmers Dating review

Badoo is definitely preferred network net just what model of exceptional sites

Bình luận của bạn

MiEdu - AI Your Career

Bài viết mới nhất

Theo dõi trên Facebook

Chia sẻ bài viết cho bạn bè

Share on facebook
Share on linkedin

© Copyright 2021 - Công ty Đào tạo và Hướng nghiệp thông minh Miedu

Sign Up and Start Learning

Hạn sử dụng đến 20/01/2022

TÌM HIỂU khóa
Full Stack data Science
-30%

Bảo hành học tập trọn đời cho người chuyển đổi công việc!