Bạn đã hiểu các khái niệm về Khoa học dữ liệu – Trí tuệ nhân tạo – Học máy – Học sâu

Ngày nay, chúng ta thường bắt gặp các thuật ngữ như khoa học dữ liệu, trí tuệ nhân tạo, máy học, học sâu, mạng nơ-ron và hơn thế nữa. Nhưng những từ thông dụng này thực sự có nghĩa là gì? Chúng có mối liên hệ như thế nào? Và tại sao bạn nên quan tâm đến chúng? Tôi đang cố gắng trả lời những câu hỏi này trong bài đăng này, với khả năng tốt nhất của mình. Nhưng một lần nữa, tôi không phải là chuyên gia ở đây. Đây là kiến ​​thức tôi đã thu được trong vài năm qua trong hành trình học máy và khoa học dữ liệu của mình. Tôi chắc rằng hầu hết các bạn sẽ có những cách giải thích mọi thứ tốt hơn và dễ dàng hơn tôi, vì vậy tôi rất mong được đọc các bình luận của bạn ở bên dưới. 

Khoa học dữ liệu (Data Science)

Đúng như cái tên, khoa học dữ liệu bao gồm mọi thứ liên quan đến dữ liệu và tôi khá chắc rằng bạn đã biết điều đó. Nhưng bạn có biết rằng chúng ta sử dụng khoa học dữ liệu để đưa ra các quyết định kinh doanh không? Bạn có thực sự biết khoa học dữ liệu được sử dụng như thế nào để đưa ra các quyết định kinh doanh không?

Mọi công ty công nghệ ngoài kia đều đang thu thập một lượng lớn dữ liệu. Và dữ liệu là doanh thu. Tại sao vậy? Khi bạn sở hữu càng nhiều dữ liệu, bạn có thể tạo ra nhiều thông tin chi tiết về hoạt động của doanh nghiệp. Sử dụng khoa học dữ liệu, bạn có thể phát hiện ra các mẫu trong dữ liệu mà bạn thậm chí không biết là có tồn tại. Ví dụ: bạn có thể phát hiện ra rằng một số người từng đặt chân đến Thành phố New York để đi nghỉ dưỡng có nhiều khả năng sẽ chi tiêu cho một chuyến du lịch sang trọng tới Venice trong ba tuần tới. Đó là một ví dụ mà tôi vừa tạo ra, có thể không đúng trong thế giới thực. Nhưng nếu bạn là một công ty cung cấp các chuyến du lịch sang trọng đến những điểm đến kỳ lạ, bạn có thể quan tâm đến việc xin số liên lạc của những người này.

Khoa học dữ liệu đang được sử dụng rộng rãi trong các tình huống như trên. Các công ty đang sử dụng khoa học dữ liệu để xây dựng công cụ đề xuất và dự đoán hành vi của người dùng, v.v. Tất cả điều này chỉ có thể thực hiện được khi bạn có đủ lượng dữ liệu để các thuật toán khác nhau có thể được áp dụng trên loại dữ liệu đó để cung cấp cho bạn kết quả chính xác hơn.

Ngoài ra, trong Khoa học dữ liệu, chúng ta có các phân tích mô tả (prescriptive analytics) trong khoa học dữ liệu, thực hiện khá nhiều dự đoán giống như chúng ta đã nói trong ví dụ về khách du lịch giàu có ở trên. Lợi ích của việc phân tích mô tả cũng sẽ cho bạn biết loại tour du lịch sang trọng nào mà một người có thể quan tâm. Ví dụ: một người có thể muốn bay hạng nhất nhưng cũng cảm thấy ổn với chỗ ở ba sao, trong khi một người khác có thể đã sẵn sàng để bay tiết kiệm nhưng chắc chắn cần một kỳ nghỉ sang trọng nhất và trải nghiệm văn hóa đa dạng. Vì vậy, mặc dù cả hai người này sẽ là khách hàng giàu có của bạn, nhưng cả hai đều có những yêu cầu khác nhau. Vì vậy, bạn có thể sử dụng phân tích mô tả cho việc ra quyết định hành động.

Bạn có thể tự hỏi ví dụ trên nghe có vẻ giống trí tuệ nhân tạo. Và bạn không sai hoàn toàn. Bởi vì việc chạy các thuật toán học máy (machine learning) trên các tập dữ liệu khổng lồ lại là một phần của khoa học dữ liệu. Máy học được sử dụng trong khoa học dữ liệu để đưa ra dự đoán và cũng để khám phá các mẫu trong dữ liệu. Vậy bạn đã hiểu thế nào là Trí tuệ nhân tạo?

Trí tuệ nhân tạo (Artificial Intelligence)

Trí tuệ nhân tạo, hay gọi tắt là AI, đã xuất hiện từ giữa những năm 1950. Nó không còn là khái niệm quá mới. Nhưng nó đã trở nên siêu phổ biến gần đây vì những tiến bộ trong khả năng xử lý. Trở lại những năm 1900, chúng ta chưa có đủ siêu máy tính để hiện thực hóa AI. Ngày nay, chúng ta đã phát triển máy tính nhanh nhất thế giới. Và việc triển khai thuật toán đã được cải thiện rất nhiều để có thể chạy AI trên phần cứng, thậm chí cả máy tính xách tay hoặc điện thoại thông minh mà bạn đang sử dụng để đọc nội dung này ngay lúc này. Và với khả năng dường như vô tận của AI, ai cũng muốn trở thành một phần của nó.

Nhưng chính xác thì trí tuệ nhân tạo là gì? Trí tuệ nhân tạo là khả năng có thể được truyền cho máy tính, cho phép các máy này hiểu dữ liệu, học hỏi từ dữ liệu và đưa ra quyết định dựa trên các mẫu ẩn trong dữ liệu hoặc các suy luận có thể rất khó (gần như không thể) đối với con người. để thực hiện thủ công. AI cũng cho phép máy móc điều chỉnh “kiến thức” của chúng dựa trên các đầu vào mới không phải là một phần của dữ liệu được sử dụng để đào tạo các máy móc này.

Một cách khác để định nghĩa AI là đó là một tập hợp các thuật toán toán học giúp máy tính hiểu mối quan hệ giữa các loại và phần dữ liệu khác nhau để kiến ​​thức về các kết nối này có thể được sử dụng để đưa ra kết luận hoặc đưa ra quyết định có thể chính xác ở mức độ rất cao. .

Nhưng có một điều bạn cần đảm bảo rằng bạn có đủ dữ liệu để AI học hỏi. Nếu bạn có một hồ dữ liệu rất nhỏ để đào tạo mô hình AI của mình, thì độ chính xác của dự đoán hoặc quyết định sẽ rất thấp. Vì vậy, càng nhiều dữ liệu, thì việc đào tạo mô hình AI sẽ tốt hơn, và kết quả sẽ chính xác hơn. Tùy thuộc vào kích thước dữ liệu đào tạo của bạn, bạn có thể chọn các thuật toán khác nhau cho mô hình của mình. Đây là lúc máy học và học sâu bắt đầu xuất hiện.

Trong những ngày đầu của AI, mạng nơ-ron là một khái niệm nổi bật. Có nhiều nhóm nghiên cứu trên toàn cầu đang làm việc để cải thiện mạng lưới thần kinh. Nhưng như tôi đã đề cập trước đó trong bài viết, những hạn chế của loại phần cứng máy tính đã cản trở sự phát triển của AI. Nhưng từ cuối những năm 1980 cho đến những năm 2010, máy học hoạt động. Mọi công ty công nghệ lớn đều đầu tư rất nhiều vào học máy. Các công ty như Google, Amazon, IBM, Facebook, v.v. hầu như đang ra sức thu hút các Tiến sĩ về AI và ML – những người trực tiếp được đào tạo chuyên sâu từ các trường đại học. Nhưng ngày nay, công nghệ máy học cũng đang lùi bước, nổi lên công nghệ về học sâu. Chắc chắn chúng ta sẽ chứng kiến sự phát triển của AI trong vài thập kỷ tới nữa. Bạn có thể hình dung sự tiến hóa này từ hình ảnh bên dưới.

Học máy (Machine Learning)

Bây giờ hãy nói về học máy. Học máy (ML) được coi là một tập con của AI. Bạn thậm chí có thể nói rằng ML là một hoạt động của AI. Vì vậy, bất cứ khi nào bạn nghĩ đến AI, bạn có thể nghĩ đến việc áp dụng ML ở đó. Như cái tên đã làm cho nó khá rõ ràng, ML được sử dụng trong các tình huống mà chúng ta muốn máy học từ lượng dữ liệu khổng lồ được cung cấp, sau đó áp dụng kiến ​​thức học được trên các phần dữ liệu mới. Nhưng câu hỏi đặt ra là làm thế nào để một cỗ máy có thể học được?

Có nhiều cách khác nhau để khiến máy học. Các phương pháp học máy khác nhau là học có giám sát (supervised ML), học không giám sát (unsupervised ML), học bán giám sát (semi-supervised ML) và học máy tăng cường (reinforcement learning). Trong một số phương pháp này, người dùng cho máy biết đâu là tính năng hoặc biến độc lập (đầu vào) và đâu là biến phụ thuộc (đầu ra). Vì vậy, máy học được mối quan hệ giữa các biến độc lập và phụ thuộc có trong dữ liệu được cung cấp cho máy. Dữ liệu được cung cấp này được gọi là training set. Và khi giai đoạn học tập hoặc đào tạo hoàn tất, máy hoặc mô hình ML sẽ được kiểm tra trên một phần dữ liệu mà mô hình chưa gặp phải trước đó. Tập dữ liệu mới này được gọi là tập dữ liệu thử nghiệm. Có nhiều cách khác nhau để bạn có thể tách tập dữ liệu hiện có của mình giữa tập dữ liệu đào tạo và tập dữ liệu kiểm tra. Khi mô hình đã đủ trưởng thành để đưa ra kết quả đáng tin cậy và có độ chính xác cao, mô hình sẽ được triển khai cho sản xuất với các bộ dữ liệu hoàn toàn mới cho các vấn đề như dự đoán hoặc phân loại.

Có nhiều thuật toán khác nhau trong ML có thể được sử dụng cho các bài toán dự đoán, bài toán phân loại, bài toán hồi quy, v.v. Bạn có thể đã nghe nói về các thuật toán như hồi quy tuyến tính đơn giản, hồi quy đa thức, hồi quy vectơ hỗ trợ, hồi quy cây quyết định, hồi quy rừng ngẫu nhiên, K-nearest neighbours, và tương tự. Đây là một số thuật toán hồi quy và phân cụm phổ biến được sử dụng trong ML. Và có rất nhiều bước chuẩn bị hoặc tiền xử lý dữ liệu mà bạn cần phải thực hiện ngay cả trước khi đào tạo mô hình của mình. Nhưng các thư viện ML như SciKit Learn đã phát triển đến mức ngay cả một nhà phát triển ứng dụng không có bất kỳ nền tảng nào về toán học hoặc thống kê, hoặc thậm chí là AI chính thức, cũng có thể bắt đầu sử dụng các thư viện này để xây dựng, đào tạo, kiểm tra, triển khai và sử dụng các mô hình ML trong thế giới thực. Nhưng tuyệt hơn khi bạn biết các thuật toán này hoạt động như thế nào để bạn có thể đưa ra quyết định sáng suốt khi chọn một thuật toán cho vấn đề của mình. Với kiến ​​thức về ML này, bây giờ chúng ta hãy nói một chút về học sâu.

Học sâu (Deep learning)

Học sâu (DL) là một bước tiến của ML. Mặc dù ML siêu mạnh đối với hầu hết các ứng dụng, nhưng có những tình huống ML chưa thể giải quyết các vấn đề ta mong muốn. Đó là lúc học sâu được triển khai. Người ta thường tin rằng nếu tập dữ liệu đào tạo của bạn tương đối nhỏ, bạn nên sử dụng ML. Nhưng nếu bạn có một lượng lớn dữ liệu để bạn có thể đào tạo một mô hình, và nếu dữ liệu có quá nhiều tính năng và độ chính xác được xem là cực kỳ quan trọng, bạn nên chọn con đường học sâu.

Cũng cần lưu ý rằng học sâu đòi hỏi nhiều phần cứng mạnh mẽ để chạy (chủ yếu là sử dụng GPU), cần nhiều thời gian hơn để đào tạo các mô hình của bạn và nói chung là khó thực hiện hơn so với ML. Nhưng đây là một số vấn đề mà bạn phải sống chung khi bạn đang cố gắng giải quyết các vấn đề khác phức tạp hơn.

Bạn có thể đã nghe nói về TensorFlow, là một mạng thần kinh mà Google đang sử dụng rộng rãi. Về cách sử dụng học sâu, mạng nơ-ron là một loại mô hình học sâu. Những chiếc xe tự lái mà chúng ta bắt đầu thấy trong vài năm gần đây, chúng tự lái được nhờ học sâu. Có rất nhiều ứng dụng như vậy của học sâu trong thế giới hiện đại chỉ đứng sau hậu trường. Ví dụ: các dịch vụ giải trí như Netflix đang sử dụng học sâu rộng rãi để cải thiện các đề xuất của họ cho bạn và cũng để quyết định dựa trên mức độ tương tác của người dùng, chương trình nào đáng được tiếp tục sản xuất và chương trình nào cần được cắt bỏ vì chúng đang lãng phí thời gian và tiền bạc.

Hầu hết các trợ lý ảo mà chúng ta thấy ngày nay, chẳng hạn như Alexa và Trợ lý Google, sử dụng học sâu để hiểu các yêu cầu bạn đang thực hiện (Xử lý ngôn ngữ tự nhiên – NLP), giọng điệu, cảm xúc bạn đang thể hiện và cũng để xác thực giọng nói của bạn trong một số các trường hợp. Tin tức giả là một vấn đề lớn ngày nay. Các công ty không thể kiểm soát được việc lan truyền tin tức giả trên các nền tảng xã hội của họ. Vì vậy, nhiều công ty như vậy đã bắt đầu sử dụng học sâu để phát hiện các mục tin tức giả đang được lưu hành trên nền tảng của họ và sau đó thực hiện các hành động cần thiết. Vì vậy, học sâu là một vấn đề lớn ngày nay.

Nguồn bài viết: Data Science vs. Artificial Intelligence vs. Machine Learning vs. Deep Learning

Link: https://towardsdatascience.com/data-science-vs-artificial-intelligence-vs-machine-learning-vs-deep-learning-9fadd8bda583

Tác giả: Sunny Srinidhi

Biên dịch và biên tập: Mary

Bài viết có hữu ích không?

Các bài viết liên quan

how to see who likes you on tinder review

ten. Allow her to generate have confidence in you

love ru sign in

18 Wedding Class Games Your guests Would like

militarycupid-recenze Seznamka

six. Sign-up online dating sites and you can qualities one to target rich website subscribers

Escort escort orlando

Do not get myself wrong; I'm an individual guy who's towards the matchmaking

adventure-dating-nl MOBIELE SITE

There is no better method to finish your day instead of sharing that it meme gif with your loved ones?

fastflirting Zaloguj si?

The working platform are right for small hookups

puerto-rico-chat-rooms dating

Ways to get an effective screenwriting broker and you can manager action six: choose wisely

sites-de-rencontre-mexicains avis

Paree list acquisition habitation 2021 — au Top 10+ demande a placer quand d’achat d’une logement

quickflirt kosten

Lass mich daruber erzahlen ruhen Eltern, entsprechend Die leser man sagt, sie seien, Jedoch befinden Die Kunden, entsprechend Eltern schuften

writers-dating dating

Amid all this, Ghanaian ladies are nonetheless thought to be beautiful and you will classic

hot or not Zaloguj si?

Mom Necklace, Mother-in-laws Necklace, On my Date’s Mommy Necklace, Current To possess Boyfriend’s Mom Mommy’s Time

girlsdateforfree mobile site

Relationships versus. Relationships: 15 Differences You have to know In the

dating-in-spanish mobile site

Think about, when you ask some body out, it's the start of exactly what will possibly feel a committed relationship

politische-dating-sites kosten

Lass mich daruber erzahlen genau so wie verknallen einander frauen

Bình luận của bạn

© Copyright 2021 - Công ty Đào tạo và Hướng nghiệp thông minh Miedu

Sign Up and Start Learning

Hạn sử dụng đến 20/01/2022

TÌM HIỂU khóa
Full Stack data Science
-30%

Bảo hành học tập trọn đời cho người chuyển đổi công việc!