Tư duy 6 nguyên tắc để xây dựng các kỹ năng và tổ chức dựa trên dữ liệu

nguyen tac danh cho to chuc dinh huong du lieu

LỜI GIỚI THIỆU

Năm năm trước, McKinsey Global Institute (MGI) đã phát hành tài liệu Dữ liệu lớn: Biên giới tiếp theo cho sự đổi mới, cạnh tranh và năng suất. Trong những năm kể từ đó, khoa học dữ liệu đã tiếp tục đạt được những tiến bộ nhanh chóng, đặc biệt là về giới hạn của học máy và học sâu.

Các tổ chức hiện có rất nhiều dữ liệu thô kết hợp với các công cụ phân tích mạnh mẽ và tinh vi để có được thông tin chi tiết có thể cải thiện hiệu suất hoạt động và tạo ra các cơ hội thị trường mới. Nói một cách sâu sắc nhất, các quyết định của họ không còn phải được đưa ra trong bóng tối hoặc dựa trên bản năng của con người; chúng có thể dựa trên bằng chứng, thí nghiệm và dự báo chính xác hơn. Khi xem xét những tiến bộ đã đạt được trong 5 năm qua, chúng tôi thấy rằng các công ty đang đặt cược lớn vào dữ liệu và phân tích.

Nhưng việc thích ứng với thời đại ra quyết định dựa trên dữ liệu nhiều hơn không phải lúc nào cũng được chứng minh là một đề xuất đơn giản đối với mọi người hoặc tổ chức. Nhiều người đang cố gắng tìm mọi cách để phát triển các tài năng, quy trình kinh doanh và sức mạnh của tổ chức để thu được giá trị thực từ phân tích dữ liệu của họ. Điều này đang trở thành một vấn đề cấp bách, vì năng lực phân tích ngày càng là cơ sở của sự cạnh tranh trong ngành và các nhà lãnh đạo đang tìm ra những lợi thế lớn từ nó. Trong khi đó, bản thân công nghệ đang có những bước tiến lớn về phía trước – và thế hệ công nghệ tiếp theo hứa hẹn sẽ còn đột phá hơn nữa. Khả năng học máy và học sâu có rất nhiều ứng dụng trải dài và sâu vào các lĩnh vực của nền kinh tế mà cho đến nay phần lớn vẫn chưa được khai thác tối đa.

Theo Harvard Business Review, những trở ngại lớn nhất để tạo ra các doanh nghiệp dựa trên dữ liệu không phải là kỹ thuật; mà là văn hóa, một loại tư duy. Nó đủ đơn giản để mô tả cách đưa dữ liệu vào quá trình ra quyết định. Việc biến điều này trở thành bình thường, thậm chí là tự động đối với nhân viên còn khó hơn nhiều – một sự thay đổi trong tư duy mang đến một thách thức khó khăn cho tổ chức.

CÁC LỢI THẾ CỦA VIỆC HỌC MÁY, BAO GỒM VIỆC HỌC SÂU, CÓ TƯƠNG QUAN TRONG MỌI NGÀNH NGHỀ VÀ TIỀM NĂNG ĐỂ GIẢI QUYẾT MỌI VẤN ĐỀ

Các chương trình phần mềm thông thường được con người mã hóa cứng với các hướng dẫn cụ thể về các tác vụ mà chúng cần thực hiện. Ngược lại, có thể tạo ra các thuật toán “học” từ dữ liệu mà không cần được lập trình rõ ràng. Khái niệm làm nền tảng cho học máy là cung cấp cho thuật toán một số lượng lớn “trải nghiệm” (dữ liệu đào tạo) và một chiến lược tổng quát để học, sau đó để nó xác định các mẫu, liên kết và thông tin chi tiết từ dữ liệu.

Nói tóm lại, các hệ thống này được đào tạo chứ không phải được lập trình. Một số kỹ thuật học máy, chẳng hạn như hồi quy, máy vectơ hỗ trợ và phân cụm k-mean, đã được sử dụng trong nhiều thập kỷ. Những công cụ khác, mặc dù đã được phát triển trước đây, nhưng bây giờ mới trở nên khả thi khi có sẵn một lượng lớn dữ liệu và sức mạnh xử lý chưa từng có. Học sâu, một lĩnh vực nghiên cứu biên giới trong học máy, sử dụng mạng nơ-ron với nhiều lớp (do đó được gọi là “sâu”) để đẩy ranh giới của các khả năng của máy.

Các nhà khoa học dữ liệu gần đây đã đạt được những bước đột phá khi sử dụng học sâu để nhận dạng các vật thể và khuôn mặt, đồng thời hiểu và tạo ra ngôn ngữ. Học tập củng cố được sử dụng để xác định những hành động tốt nhất cần thực hiện ngay bây giờ để đạt được một số mục tiêu trong tương lai. Loại vấn đề này thường gặp trong trò chơi nhưng có thể hữu ích để giải quyết các vấn đề lý thuyết điều khiển và tối ưu hóa động – chính xác là loại vấn đề xuất hiện khi mô hình hóa các hệ thống phức tạp trong các lĩnh vực như kỹ thuật và kinh tế. Học chuyển tiếp tập trung vào việc lưu trữ kiến ​​thức thu được trong khi giải quyết một vấn đề và áp dụng nó vào một vấn đề khác. Máy học, kết hợp với các kỹ thuật khác, có thể có rất nhiều cách sử dụng.

Máy học có thể được kết hợp với các loại phân tích khác để giải quyết một loạt các vấn đề kinh doanh.

Học máy có tiềm năng rộng rãi trong các ngành và các trường hợp sử dụng.

Các mục đích sử dụng theo ngành cụ thể kết hợp sự phong phú của dữ liệu với cơ hội lớn hơn là bong bóng lớn nhất ở góc phần tư trên cùng bên phải của biểu đồ. Những điều này đại diện cho các lĩnh vực mà các tổ chức nên ưu tiên sử dụng học máy và chuẩn bị cho quá trình chuyển đổi diễn ra. Một số trường hợp sử dụng có cơ hội cao nhất bao gồm quảng cáo được cá nhân hóa; xe tự hành; tối ưu hóa giá cả, định tuyến và lập lịch dựa trên dữ liệu thời gian thực trong du lịch và hậu cần; dự đoán kết quả sức khỏe được cá nhân hóa; và tối ưu hóa chiến lược bán hàng trong bán lẻ.

Các trường hợp sử dụng ở góc phần tư trên cùng bên phải được chia thành bốn loại chính. Đầu tiên là việc cá nhân hóa triệt để các sản phẩm và dịch vụ cho khách hàng trong các lĩnh vực như hàng tiêu dùng đóng gói, tài chính và bảo hiểm, chăm sóc sức khỏe và truyền thông – một cơ hội mà hầu hết các công ty vẫn chưa khai thác hết. Thứ hai là phân tích dự đoán. Điều này bao gồm các ví dụ như sắp xếp các cuộc gọi dịch vụ khách hàng; phân khúc khách hàng dựa trên mô hình rủi ro, tình trạng hỗn loạn và mua hàng; xác định gian lận và bất thường trong ngân hàng và an ninh mạng; và chẩn đoán bệnh từ quét, sinh thiết và các dữ liệu khác.

Danh mục thứ ba là tối ưu hóa chiến lược, bao gồm các mục đích sử dụng như tối ưu hóa hàng hóa và kệ trong bán lẻ, lập lịch và chỉ định nhân viên tuyến đầu, đồng thời tối ưu hóa nhóm và các tài nguyên khác trên các khu vực địa lý và tài khoản.

Hạng mục thứ tư là tối ưu hóa hoạt động và hậu cần trong thời gian thực, bao gồm tự động hóa các nhà máy và máy móc để giảm lỗi và nâng cao hiệu quả, cũng như tối ưu hóa quản lý chuỗi cung ứng.

HIỂU BIẾT KHUNG TỔ CHỨC KHOA HỌC DỮ LIỆU BÀI BẢN

Là một tổ chức theo hướng dữ liệu có nghĩa là điều phối các nhóm khoa học dữ liệu tham gia đầy đủ vào các khâu của doanh nghiệp và điều chỉnh xương sống hoạt động của công ty (kỹ thuật, quy trình, cơ sở hạ tầng và văn hóa). Khung Tổ chức Khoa học Dữ liệu bài bản là một danh mục các phương pháp luận, công nghệ, tài nguyên, nếu được sử dụng đúng cách, sẽ hỗ trợ tổ chức của bạn (từ hiểu biết kinh doanh, tạo và thu thập dữ liệu, lập mô hình, đến triển khai và quản lý mô hình) để trở nên theo hướng dữ liệu hơn. Khung này, như thể hiện dưới đây trong Hình 1, bao gồm sáu nguyên tắc chính:

Với sự phát triển nhanh chóng của lĩnh vực này, các tổ chức và nhà khoa học dữ liệu thường cần hướng dẫn về cách áp dụng kỹ thuật khoa học dữ liệu mới nhất để giải quyết nhu cầu kinh doanh của họ hoặc để theo đuổi các cơ hội mới.

Trong các trang sắp tới, chúng ta sẽ khám phá sáu (6) nguyên tắc mà các nhà khoa học dữ liệu cũng như các tổ chức cần tuần theo để xây dựng các kỹ năng và tổ chức dựa trên dữ liệu bài bản.

NGUYÊN TẮC 1: HIỂU VỀ DOANH NGHIỆP VÀ QUÁ TRÌNH RA QUYẾT ĐỊNH

Đối với hầu hết các tổ chức, thiếu dữ liệu không phải là vấn đề. Thực tế thì ngược lại: thường có quá nhiều thông tin để đưa ra quyết định rõ ràng. Với rất nhiều dữ liệu cần sắp xếp, các tổ chức cần có một chiến lược rõ ràng để làm rõ các khía cạnh kinh doanh sau:

  • Làm thế nào khoa học dữ liệu có thể giúp các tổ chức chuyển đổi hoạt động kinh doanh, quản lý chi phí tốt hơn và thúc đẩy hoạt động xuất sắc hơn?
  • Các tổ chức có mục đích và tầm nhìn được xác định rõ ràng và rõ ràng cho những gì họ đang tìm cách hoàn thành không?
  • Làm thế nào các tổ chức có thể nhận được sự hỗ trợ của các giám đốc điều hành cấp C và các bên liên quan để thực hiện tầm nhìn theo hướng dữ liệu đó và thúc đẩy nó thông qua các bộ phận khác nhau của doanh nghiệp?

Tóm lại, các công ty cần hiểu rõ về quy trình ra quyết định kinh doanh của họ và có chiến lược khoa học dữ liệu tốt hơn để hỗ trợ quy trình đó.

Với tư duy khoa học dữ liệu đúng đắn, thứ từng là một khối lượng lớn thông tin khác nhau sẽ trở thành một điểm quyết định đơn giản và rõ ràng.

Việc thúc đẩy chuyển đổi đòi hỏi các công ty phải có mục đích và tầm nhìn được xác định rõ ràng và rõ ràng về những gì họ đang tìm cách hoàn thành. Nó thường yêu cầu sự hỗ trợ của một giám đốc điều hành cấp C để đưa ra tầm nhìn đó và thúc đẩy nó thông qua các bộ phận khác nhau của doanh nghiệp.

Các tổ chức phải bắt đầu với những câu hỏi phù hợp. Các câu hỏi phải đo lường được, rõ ràng, ngắn gọn và có liên quan trực tiếp đến hoạt động kinh doanh cốt lõi của họ. Trong giai đoạn này, điều quan trọng là phải thiết kế các câu hỏi để đủ điều kiện hoặc loại các giải pháp tiềm năng cho một vấn đề hoặc cơ hội kinh doanh cụ thể. Ví dụ, hãy bắt đầu với một vấn đề được xác định rõ ràng: một công ty bán lẻ đang gặp phải chi phí gia tăng và không còn khả năng cung cấp giá cả cạnh tranh cho khách hàng của mình. Một trong nhiều câu hỏi để giải quyết vấn đề kinh doanh này có thể bao gồm: công ty có thể giảm hoạt động của mình mà không ảnh hưởng đến chất lượng không?

Có hai nhiệm vụ chính mà tổ chức cần giải quyết để trả lời loại câu hỏi đó:

  • Xác định mục tiêu kinh doanh: nhóm Khoa học Dữ liệu cần làm việc với các chuyên gia kinh doanh và các bên liên quan khác để hiểu và xác định các vấn đề kinh doanh.
  • Hình thành các câu hỏi đúng: các công ty cần hình thành các câu hỏi hữu hình xác định các mục tiêu kinh doanh mà nhóm khoa học dữ liệu có thể nhắm đến.

USE CASE:

Francesca Lazzeri, Tiến sĩ (Twitter: @frlazzeri) là Nhà khoa học Máy học Cấp cao tại Microsoft trong nhóm Cloud Advocacy và là chuyên gia về các đổi mới công nghệ dữ liệu lớn và ứng dụng của các giải pháp dựa trên máy học cho các vấn đề trong thế giới thực.

Năm ngoái, nhóm Azure Machine Learning đã phát triển giải pháp phân bổ nhân viên dựa trên đề xuất cho một công ty dịch vụ chuyên nghiệp. Bằng cách sử dụng dịch vụ Azure Machine Learning, chúng tôi đã xây dựng và triển khai giải pháp đề xuất vị trí lực lượng lao động nhằm đề xuất thành phần nhân viên tối ưu và từng nhân viên có kinh nghiệm và chuyên môn phù hợp cho các dự án mới. Mục tiêu kinh doanh cuối cùng của giải pháp của chúng tôi là cải thiện lợi nhuận của khách hàng.

Việc bố trí nhân sự cho dự án được thực hiện theo cách thủ công bởi các nhà quản lý dự án và dựa trên sự sẵn có của nhân viên và kiến ​​thức trước đây về kết quả hoạt động trong quá khứ của một cá nhân. Quá trình này tốn nhiều thời gian và kết quả thường không tối ưu. Quá trình này có thể được thực hiện hiệu quả hơn nhiều bằng cách tận dụng dữ liệu lịch sử và các kỹ thuật học máy tiên tiến.

Để chuyển vấn đề kinh doanh này thành các giải pháp và kết quả hữu hình, chúng tôi đã giúp khách hàng đặt ra các câu hỏi phù hợp, chẳng hạn như:

  1. Làm thế nào chúng tôi có thể dự đoán thành phần nhân viên cho một dự án mới? Ví dụ: một người quản lý chương trình cấp cao, một nhà khoa học dữ liệu chính và hai trợ lý kế toán.
  2. Làm cách nào chúng ta có thể tính được Điểm thể lực của Nhân viên (Staff Fitness Score) cho một dự án mới? Chúng tôi đã xác định Điểm thể lực của nhân viên làm thước đo để đánh giá mức độ phù hợp của nhân viên với một dự án.

Mục tiêu của giải pháp máy học của chúng tôi là đề xuất nhân viên thích hợp nhất cho một dự án mới, dựa trên khả năng sẵn có của nhân viên, vị trí địa lý, kinh nghiệm loại dự án, kinh nghiệm trong ngành và tỷ suất đóng góp hàng giờ được tạo cho các dự án trước đó.

Những giải pháp này có thể giải quyết những lỗ hổng hoặc sự kém hiệu quả trong việc phân bổ nhân viên của tổ chức cần được khắc phục để thúc đẩy kết quả kinh doanh tốt hơn. Các tổ chức có thể đạt được lợi thế cạnh tranh bằng cách sử dụng phân tích lực lượng lao động để tập trung vào việc tối ưu hóa việc sử dụng vốn nhân lực của họ.

Trong các bước tiếp theo, chúng ta sẽ cùng nhau xem cách Francesca và nhóm của cô ấy đã xây dựng giải pháp này cho khách hàng của họ thông qua tư duy khoa học dữ liệu như thế nào.

NGUYÊN TẮC 2: THIẾT LẬP CÁC PHƯƠNG PHÁP THỰC HIỆN

Để chuyển thành công tầm nhìn và mục tiêu kinh doanh này thành các kết quả có thể thực hiện được, bước tiếp theo là thiết lập các thước đo hiệu suất rõ ràng. Trong bước thứ hai này, các tổ chức cần tập trung vào hai khía cạnh phân tích quan trọng để xác định đường dẫn giải pháp dữ liệu (Hình 2) cũng như:

  • Cách tiếp cận phân tích tốt nhất để giải quyết vấn đề kinh doanh đó và đưa ra kết luận chính xác là gì?
  • Làm thế nào để tầm nhìn đó được chuyển thành các kết quả có thể thực hiện được để có thể cải thiện hoạt động kinh doanh?

Bước này chia thành ba bước phụ:

  1. Quyết định những gì cần đo

Hãy thực hiện Bảo trì Dự đoán (Predictive Maintenance), một kỹ thuật được sử dụng để dự đoán khi nào – máy dịch vụ sẽ bị lỗi, cho phép lên kế hoạch bảo trì trước. Hóa ra, đây là một lĩnh vực rất rộng với nhiều mục tiêu cuối cùng, chẳng hạn như dự đoán nguyên nhân gốc rễ của hư hỏng, bộ phận nào sẽ cần thay thế và khi đưa ra các khuyến nghị bảo trì sau khi hỏng hóc xảy ra, v.v.

Nhiều công ty đang cố gắng bảo trì dự đoán và có sẵn hàng đống dữ liệu từ tất cả các loại cảm biến và hệ thống. Tuy nhiên, vấn đề phổ biến là khách hàng không có đủ dữ liệu về lịch sử hỏng hóc của họ và điều đó khiến việc bảo trì dự đoán rất khó khăn – sau cùng, các mô hình cần được đào tạo về dữ liệu lịch sử hỏng hóc đó để dự đoán các sự cố hỏng hóc trong tương lai. Vì vậy, mặc dù điều quan trọng là phải vạch ra tầm nhìn, mục đích và phạm vi của bất kỳ dự án phân tích nào, nhưng điều quan trọng là bạn phải bắt đầu bằng cách thu thập dữ liệu phù hợp. Nếu vấn đề là dự đoán sự cố của hệ thống kéo, dữ liệu đào tạo phải bao gồm tất cả các thành phần khác nhau của hệ thống kéo. Trường hợp đầu tiên nhắm mục tiêu vào một thành phần cụ thể trong khi trường hợp thứ hai nhắm mục tiêu đến sự thất bại của một hệ thống con lớn hơn. Khuyến nghị chung là thiết kế hệ thống dự đoán về các thành phần cụ thể hơn là các hệ thống con lớn hơn.

Với các nguồn dữ liệu trên, hai loại dữ liệu chính được quan sát trong miền bảo trì dự đoán là: 1) dữ liệu tạm thời (chẳng hạn như đo từ xa hoạt động, điều kiện máy, loại thứ tự công việc, mã ưu tiên sẽ có dấu thời gian tại thời điểm ghi. Lỗi, bảo trì / sửa chữa và lịch sử sử dụng cũng sẽ có dấu thời gian liên quan đến từng sự kiện); và 2) dữ liệu tĩnh (nói chung các tính năng của máy và tính năng của người vận hành là tĩnh vì chúng mô tả các thông số kỹ thuật của máy hoặc thuộc tính của người vận hành. Nếu các tính năng này có thể thay đổi theo thời gian thì chúng cũng phải có dấu thời gian đi kèm). Biến dự đoán và biến mục tiêu phải được xử lý trước / chuyển đổi thành các kiểu dữ liệu số, phân loại và các kiểu dữ liệu khác tùy thuộc vào thuật toán đang được sử dụng.

  1. Quyết định cách đo lường

Suy nghĩ về cách các tổ chức đo lường dữ liệu của họ cũng quan trọng không kém, đặc biệt là trước giai đoạn thu thập và nhập dữ liệu. Các câu hỏi chính cần hỏi cho bước phụ này bao gồm:

  • Khung thời gian là gì?
  • Đơn vị đo là gì?
  • Cần bao gồm những yếu tố nào?

Mục tiêu trọng tâm của bước này là xác định các biến số kinh doanh chính và phân tích cần dự đoán. Chúng tôi coi các biến này là mục tiêu của mô hình và chúng tôi sử dụng các số liệu liên quan đến chúng để xác định sự thành công của dự án. Hai ví dụ về các mục tiêu đó là dự báo bán hàng hoặc xác suất đơn đặt hàng bị gian lận.

  1. Xác định các số liệu thành công

Sau khi xác định các biến số kinh doanh chính, điều quan trọng là phải chuyển vấn đề kinh doanh của bạn thành một câu hỏi khoa học dữ liệu và xác định các số liệu sẽ xác định thành công dự án của bạn. Các tổ chức thường sử dụng khoa học dữ liệu hoặc học máy để trả lời năm loại câu hỏi:

  • Bao nhiêu hoặc bấy nhiêu? (hồi quy – regression)
  • Loại nào? (phân loại – classification)
  • Nhóm nào? (phân cụm – clustering)
  • Điều này có lạ không? (phát hiện bất thường – anomaly detection)
  • Tùy chọn nào nên được thực hiện? (khuyến nghị – recommendation)

Xác định câu hỏi mà công ty đang hỏi và cách trả lời câu hỏi đó đạt được mục tiêu kinh doanh và cho phép đo lường kết quả. Tại thời điểm này, điều quan trọng là phải xem lại các mục tiêu của dự án bằng cách hỏi và chọn lọc các câu hỏi sắc bén có liên quan, cụ thể và rõ ràng.

Ví dụ: nếu một công ty muốn đạt được dự đoán về tỷ lệ khách hàng dừng sử dụng sản phẩm dịch vụ, họ sẽ cần tỷ lệ chính xác là “x” phần trăm vào cuối dự án ba tháng. Với dữ liệu này, các công ty có thể đưa ra các chương trình khuyến mãi dành cho khách hàng để giảm tình trạng gián đoạn.

Trong trường hợp công ty dịch vụ chuyên nghiệp của chúng tôi, chúng tôi quyết định giải quyết câu hỏi kinh doanh đầu tiên (Làm thế nào chúng tôi có thể dự đoán thành phần nhân viên, ví dụ: một kế toán cấp cao và hai trợ lý kế toán, cho một dự án mới?). Đối với sự tham gia của khách hàng này, chúng tôi đã sử dụng dữ liệu lịch sử hàng ngày của dự án trong 5 năm ở cấp độ cá nhân. Chúng tôi đã xóa bất kỳ dữ liệu nào có biên đóng góp âm hoặc tổng số giờ âm. Đầu tiên, chúng tôi lấy mẫu ngẫu nhiên 1000 dự án từ tập dữ liệu thử nghiệm để tăng tốc độ điều chỉnh tham số. Sau khi xác định tổ hợp tham số tối ưu, chúng tôi chạy chuẩn bị dữ liệu giống nhau trên tất cả các dự án trong tập dữ liệu thử nghiệm.

Dưới đây (Hình 3) là phần trình bày loại dữ liệu và luồng giải pháp mà chúng tôi đã xây dựng cho sự tương tác này:

Chúng tôi đã sử dụng một phương pháp phân cụm: thuật toán k-nearest neighbors (KNN). KNN là một thuật toán học máy có giám sát đơn giản, dễ thực hiện. Thuật toán KNN giả định rằng những thứ tương tự tồn tại gần nhau, tìm các điểm dữ liệu tương tự nhất trong dữ liệu đào tạo và đưa ra phỏng đoán học được dựa trên phân loại của chúng. Mặc dù rất đơn giản để hiểu và thực hiện, phương pháp này đã được ứng dụng rộng rãi trong nhiều lĩnh vực, chẳng hạn như trong hệ thống khuyến nghị, tìm kiếm ngữ nghĩa và phát hiện bất thường.

Trong bước đầu tiên này, chúng tôi sử dụng KNN để dự đoán thành phần nhân viên, tức là số lượng của mỗi phân loại / chức danh nhân viên, của một dự án mới bằng cách sử dụng dữ liệu dự án lịch sử. Chúng tôi nhận thấy các dự án lịch sử tương tự như dự án mới dựa trên các thuộc tính dự án khác nhau, chẳng hạn như Loại dự án, Tổng thanh toán, Ngành, Khách hàng, Phạm vi doanh thu, v.v. Chúng tôi đã chỉ định các trọng số khác nhau cho từng thuộc tính dự án dựa trên các quy tắc và tiêu chuẩn kinh doanh. Chúng tôi cũng đã xóa bất kỳ dữ liệu nào có tỷ suất lợi nhuận đóng góp âm (lợi nhuận). Đối với mỗi phân loại nhân viên, số lượng nhân viên được dự đoán bằng cách tính tổng có trọng số của số lượng nhân viên của các dự án lịch sử tương tự của phân loại nhân viên tương ứng. Các trọng số cuối cùng được chuẩn hóa để tổng của tất cả các trọng số là 1. Trước khi tính tổng có trọng số, chúng tôi đã loại bỏ 10% giá trị ngoại lệ với giá trị cao và 10% ngoại lệ với giá trị thấp.

Đối với câu hỏi kinh doanh thứ hai (Làm cách nào chúng tôi có thể tính Điểm thể lực của nhân viên cho một dự án mới?), Chúng tôi quyết định sử dụng phương pháp lọc dựa trên nội dung tùy chỉnh: cụ thể là chúng tôi đã triển khai một thuật toán dựa trên nội dung để dự đoán mức độ phù hợp của trải nghiệm của nhân viên với dự án nhu cầu. Trong hệ thống lọc dựa trên nội dung, hồ sơ người dùng thường được tính dựa trên xếp hạng lịch sử của người dùng trên các mặt hàng. Hồ sơ người dùng này mô tả thị hiếu và sở thích của người dùng. Để dự đoán mức độ phù hợp của nhân viên cho một dự án mới, chúng tôi đã tạo hai vectơ hồ sơ nhân viên cho mỗi nhân viên bằng cách sử dụng dữ liệu lịch sử: một vectơ dựa trên số giờ mô tả kinh nghiệm và chuyên môn của nhân viên đối với các loại dự án khác nhau; vectơ khác dựa trên tỷ suất lợi nhuận đóng góp mỗi giờ (CMH) mô tả khả năng sinh lời của nhân viên đối với các loại dự án khác nhau. Điểm thể lực của nhân viên cho một dự án mới được tính bằng cách lấy các tích số bên trong giữa hai vectơ hồ sơ nhân viên này và một vectơ nhị phân mô tả các thuộc tính quan trọng của một dự án.

Chúng tôi đã triển khai các bước học máy này bằng dịch vụ Azure Machine Learning. Sử dụng SDK Python chính và SDK chuẩn bị dữ liệu cho Azure Machine Learning, chúng tôi đã xây dựng và đào tạo các mô hình học máy của mình trong Không gian làm việc của dịch vụ Máy học Azure. Không gian làm việc này là tài nguyên cấp cao nhất cho dịch vụ và cung cấp một nơi tập trung để làm việc với tất cả các thành phần mà chúng tôi đã tạo cho dự án này.

Để tạo không gian làm việc, chúng tôi đã xác định các cấu hình sau:

Tên không gian làm việc

Nhập một tên duy nhất xác định không gian làm việc của bạn. Tên phải là duy nhất trong nhóm tài nguyên. Sử dụng tên dễ nhớ và dễ phân biệt với không gian làm việc do người khác tạo.

Đăng ký

Chọn đăng ký Azure mà bạn muốn sử dụng.

Nhóm tài nguyên

Sử dụng nhóm tài nguyên hiện có trong đăng ký của bạn hoặc nhập tên để tạo nhóm tài nguyên mới. Nhóm tài nguyên là một vùng chứa chứa các tài nguyên liên quan cho một giải pháp Azure.

Vị trí

Chọn vị trí gần người dùng của bạn nhất và các tài nguyên dữ liệu. Vị trí này là nơi tạo không gian làm việc.

Khi chúng tôi tạo không gian làm việc, các tài nguyên Azure sau đây đã được thêm tự động:

  • Azure Container Registry
  • Azure Storage
  • Azure Application Insights
  • Azure Key Vault

Không gian làm việc lưu giữ một danh sách các mục tiêu tính toán mà bạn có thể sử dụng để đào tạo mô hình của mình. Nó cũng lưu lại lịch sử của quá trình đào tạo, bao gồm nhật ký, số liệu, kết quả đầu ra và ảnh chụp nhanh các tập lệnh của bạn. Chúng tôi đã sử dụng thông tin này để xác định hoạt động đào tạo nào tạo ra mô hình tốt nhất.

Sau khi, chúng tôi đăng ký các mô hình của mình với không gian làm việc và chúng tôi sử dụng mô hình đã đăng ký và các tập lệnh cho điểm để tạo hình ảnh sử dụng cho việc triển khai (chi tiết hơn về kiến ​​trúc end-to-end được xây dựng cho trường hợp sử dụng này sẽ được thảo luận bên dưới). Dưới đây là mô tả khái niệm không gian làm việc và luồng học máy (Hình 4):

Thiết kế chương trình training

Dịch vụ xây dựng chương trình tư vấn, đào tạo Data Science theo yêu cầu cho doanh nghiệp của MiEdu

Nguyên tắc 3: Kiến trúc giải pháp từ đầu đến cuối 

Trong kỷ nguyên Dữ liệu lớn, ngày càng có nhiều xu hướng tích lũy và phân tích dữ liệu, thường là phi cấu trúc, đến từ các ứng dụng, môi trường web và nhiều loại thiết bị. Trong bước thứ ba này, các tổ chức cần suy nghĩ một cách hữu cơ hơn về kiến ​​trúc và luồng dữ liệu end-to-end sẽ hỗ trợ các giải pháp khoa học dữ liệu của họ và tự hỏi bản thân những câu hỏi sau:

  • Họ có thực sự cần khối lượng dữ liệu này không?
  • Làm thế nào để họ đảm bảo tính toàn vẹn và độ tin cậy của nó?
  • Họ nên lưu trữ, xử lý và thao tác dữ liệu này như thế nào để trả lời các câu hỏi của tổ chức?
  • Và quan trọng nhất, họ sẽ tích hợp giải pháp khoa học dữ liệu này vào hoạt động kinh doanh và hoạt động của chính họ như thế nào để có thể sử dụng thành công nó theo thời gian?

Kiến trúc dữ liệu là quá trình lập kế hoạch thu thập dữ liệu, bao gồm định nghĩa của thông tin sẽ được thu thập, các tiêu chuẩn và quy chuẩn sẽ được sử dụng để cấu trúc dữ liệu và các công cụ được sử dụng để trích xuất, lưu trữ và xử lý dữ liệu đó.

Giai đoạn này là cơ bản đối với bất kỳ dự án nào thực hiện phân tích dữ liệu, vì nó là điều đảm bảo tính sẵn có và tính toàn vẹn của thông tin sẽ được khám phá trong tương lai. Để làm được điều này, bạn cần hiểu cách dữ liệu sẽ được lưu trữ, xử lý và sử dụng cũng như những phân tích nào sẽ được mong đợi cho dự án. Có thể nói, tại thời điểm này có sự giao thoa giữa tầm nhìn kỹ thuật và chiến lược của dự án, vì mục đích của nhiệm vụ lập kế hoạch này là giữ cho các quy trình khai thác và thao tác dữ liệu phù hợp với mục tiêu của doanh nghiệp.

Sau khi đã xác định các mục tiêu kinh doanh (Nguyên tắc 1) và chuyển chúng thành các thước đo hữu hình (Nguyên tắc 2), bây giờ cần phải lựa chọn các công cụ phù hợp để cho phép một tổ chức thực sự xây dựng một giải pháp khoa học dữ liệu đầu cuối. Các yếu tố như khối lượng, sự đa dạng của dữ liệu và tốc độ chúng được tạo và xử lý sẽ giúp các công ty xác định loại công nghệ nào họ nên sử dụng. Trong số các danh mục hiện có khác nhau, điều quan trọng cần xem xét là:

  • Các công cụ thu thập dữ liệu, chẳng hạn như Azure Stream AnalyticsAzure Data Factory Đây là những công cụ sẽ giúp chúng tôi trích xuất và tổ chức dữ liệu thô.
  • Các công cụ lưu trữ, chẳng hạn như Azure Cosmos DBAzure Storage: Các công cụ này lưu trữ dữ liệu ở dạng có cấu trúc hoặc không có cấu trúc và có thể tổng hợp thông tin từ một số nền tảng theo cách tích hợp
  • Các công cụ xử lý và phân tích dữ liệu, chẳng hạn như Azure Time Series InsightsAzure Machine Learning Chuẩn bị dữ liệu dịch vụ  Với những dữ liệu này, chúng tôi sử dụng dữ liệu được lưu trữ và xử lý để tạo logic trực quan hóa cho phép phát triển các phân tích, nghiên cứu và báo cáo hỗ trợ
  • các công cụ vận hành Mô hình ra quyết định chiến lược và hoạt động, chẳng hạn như dịch vụ Azure Machine LearningMachine Learning Server: Sau khi một công ty có một tập hợp các mô hình hoạt động tốt, họ có thể vận hành chúng để các ứng dụng khác sử dụng. Tùy thuộc vào yêu cầu kinh doanh, các dự đoán được đưa ra theo thời gian thực hoặc theo lô. Để triển khai các mô hình, các công ty cần hiển thị chúng với một giao diện API mở. Giao diện cho phép dễ dàng sử dụng mô hình từ các ứng dụng khác nhau, chẳng hạn như:
  • Các trang web trực tuyến
  • Bảng tính
  • Trang tổng quan
  • Dòng của doanh nghiệp (LoB)
  • ứng dụng phụ

Các tích hợp giữa chúng để cho phép dữ liệu được sử dụng trong bất kỳ nền tảng nào đã chọn mà không cần xử lý thủ công. Kiến trúc end-to-end này (Hình 5) cũng sẽ cung cấp một số lợi thế và giá trị chính cho các công ty, chẳng hạn như:

Hình 5. Ví dụ về kiến ​​trúc end-to-end

  • Triển khai tăng tốc & giảm rủi ro: Một kiến ​​trúc end-to-end tích hợp có thể Giảm thiểu đáng kể chi phí và nỗ lực cần thiết để kết hợp một giải pháp end-to-end và hơn nữa cho phép tăng thời gian triển khai các trường hợp sử dụng.
  • Tính mô-đun: Cho phép các công ty bắt đầu ở bất kỳ phần nào của kiến ​​trúc end-to-end với sự đảm bảo rằng các thành phần chính sẽ tích hợp và phù hợp với nhau
  • Tính linh hoạt: Chạy ở mọi nơi kể cả môi trường đa đám mây hoặc đám mây lai
  • Phân tích từ đầu đến cuối & Học máy: Cho phép phân tích từ đầu đến cuối, với khả năng đẩy các mô hình học máy trở lại lợi thế để đưa ra quyết định theo thời gian thực
  • Bảo mật và tuân thủ dữ liệu từ đầu đến cuối: Khả năng quản lý và bảo mật được tích hợp trước trên toàn bộ kiến ​​trúc bao gồm truy cập, ủy quyền và xác thực
  • Cho phép đổi mới nguồn mở: Được xây dựng bằng các dự án nguồn mở và mô hình đổi mới cộng đồng sôi động đảm bảo các tiêu chuẩn mở

Trong trường hợp là công ty dịch vụ chuyên nghiệp của chúng tôi, kiến ​​trúc giải pháp của chúng tôi bao gồm các thành phần sau (Hình 6):

Hình 6. Kiến trúc end-to-end do Microsoft phát triển Nhóm Azure ML

  1. Các nhà khoa học dữ liệu đào tạo một mô hình sử dụng Azure Machine Learning và một cụm HDInsight. Azure HDInsight là một dịch vụ phân tích mã nguồn mở, toàn phổ, được quản lý cho các doanh nghiệp. HDInsight là một dịch vụ đám mây giúp xử lý một lượng lớn dữ liệu dễ dàng, nhanh chóng và tiết kiệm chi phí. Mô hình được đóng gói và đưa vào Cơ quan đăng ký vùng chứa Azure. Azure Container Registry cho phép bạn xây dựng, lưu trữ và quản lý hình ảnh cho tất cả các loại triển khai vùng chứa. Đối với sự tham gia của khách hàng cụ thể này, chúng tôi đã tạo một phiên bản Đăng ký vùng chứa Azure bằng Azure CLI. Sau đó, sử dụng các lệnh Docker để đẩy hình ảnh vùng chứa vào sổ đăng ký và cuối cùng kéo và chạy hình ảnh từ sổ đăng ký của bạn. Azure CLI là một công cụ dòng lệnh cung cấp trải nghiệm tuyệt vời để quản lý tài nguyên Azure. CLI được thiết kế để giúp tạo tập lệnh dễ dàng, truy vấn dữ liệu, hỗ trợ các hoạt động lâu dài và hơn thế nữa.
  2. Mô hình được triển khai thông qua trình cài đặt ngoại tuyến tới một cụm Kubernetes trên Azure Stack. Azure Kubernetes Service (AKS) đơn giản hóa việc quản lý Kubernetes bằng cách cho phép dễ dàng cung cấp các cụm thông qua các công cụ như Azure CLI và bằng cách hợp lý hóa việc bảo trì cụm với các nâng cấp và mở rộng tự động. Ngoài ra, khả năng tạo các cụm GPU cho phép AKS được sử dụng để phân phát hiệu suất cao và tự động mở rộng quy mô của các mô hình học máy.
  3. Người dùng cuối cung cấp dữ liệu được cho điểm so với mô hình. Quá trình áp dụng mô hình dự đoán cho một tập dữ liệu được gọi là ghi điểm dữ liệu. Khi một mô hình đã được xây dựng, các thông số kỹ thuật của mô hình có thể được lưu trong một tệp chứa tất cả các thông tin cần thiết để xây dựng lại mô hình. Sau đó, bạn có thể sử dụng tệp mô hình đó để tạo điểm số dự đoán trong các tập dữ liệu khác
  4. Thông tin chi tiết và các điểm bất thường từ điểm số được lưu trữ để tải lên sau này. Bộ lưu trữ Azure Blob được sử dụng để lưu trữ tất cả dữ liệu của dự án. Azure Machine Learning Service tích hợp với lưu trữ Blob để người dùng không phải di chuyển dữ liệu theo cách thủ công giữa các nền tảng máy tính và lưu trữ Blob. Lưu trữ khối cũng rất hiệu quả về chi phí đối với hiệu suất mà khối lượng công việc này yêu cầu.
  5. Thông tin chi tiết tuân thủ và phù hợp toàn cầu có sẵn trong ứng dụng toàn cầu. Azure App Service là dịch vụ lưu trữ các ứng dụng web, API REST và thiết bị di động. Dịch vụ ứng dụng không chỉ bổ sung sức mạnh của Microsoft Azure cho ứng dụng của bạn, chẳng hạn như bảo mật, cân bằng tải, tự động thay đổi tỷ lệ và quản lý tự động. Bạn cũng có thể tận dụng các khả năng DevOps của nó, chẳng hạn như triển khai liên tục từ Azure DevOps, GitHub., Docker Hub và các nguồn khác, quản lý gói, môi trường dàn, miền tùy chỉnh và chứng chỉ SSL.
  6. Cuối cùng, dữ liệu từ tính điểm cạnh được sử dụng để cải thiện mô hình.

Nguyên tắc 4: Xây dựng Toolbox về các kỹ thuật Khoa học Dữ liệu 

Khi làm việc với giải pháp phân bổ nhân viên dựa trên đề xuất cho công ty dịch vụ chuyên nghiệp, chúng tôi ngay lập tức nhận ra rằng họ bị giới hạn về thời gian và không có nguồn tài nguyên máy tính vô hạn. Làm thế nào các tổ chức có thể tổ chức công việc của họ để họ có thể duy trì năng suất tối đa?

Danh mục các thủ thuật khác nhau để tối ưu hóa công việc và đẩy nhanh thời gian sản xuất, ví dụ: 

  • Sự hiểu biết rõ ràng về những gì họ cần đạt được về các tính năng, hàm mất mát, chỉ số và giá trị của siêu tham số, sau đó mở rộng quy mô mọi thứ.
  • Tái sử dụng kiến ​​thức thu được từ các dự án trước: Nhiều vấn đề khoa học dữ liệu tương tự như một bài toán khác. Việc sử dụng lại các giá trị tốt nhất của siêu tham số hoặc trình trích xuất tính năng từ các vấn đề tương tự mà các nhà khoa học dữ liệu khác đã giải quyết trong quá khứ sẽ giúp các tổ chức tiết kiệm rất nhiều thời gian.
  • Thiết lập cảnh báo tự động sẽ thông báo cho nhóm khoa học dữ liệu rằng một thử nghiệm cụ thể đã kết thúc: Điều này sẽ giúp nhóm khoa học dữ liệu tiết kiệm thời gian trong trường hợp có sự cố với thử nghiệm.
  • Sử dụng sổ ghi chép Jupyter để tạo mẫu nhanh: Các nhà khoa học dữ liệu có thể viết lại mã của họ thành các gói / lớp Python khi họ hài lòng với kết quả.
  • Giữ mã thử nghiệm của bạn trong hệ thống kiểm soát phiên bản, chẳng hạn như GitHub.
  • Sử dụng môi trường được định cấu hình trước trong đám mây để phát triển khoa học dữ liệu: Đây là các hình ảnh máy ảo (chẳng hạn như Máy ảo WindowsKhoa học dữ liệu Azure), được cài đặt sẵn, định cấu hình và thử nghiệm bằng một số công cụ phổ biến thường được sử dụng để phân tích dữ liệu, đào tạo máy học.

Có danh sách những việc cần làm trong khi các thử nghiệm đang chạy: thu thập dữ liệu, dọn dẹp, chú thích; đọc về các chủ đề khoa học dữ liệu mới, thử nghiệm với một thuật toán hoặc một khuôn khổ mới. Tất cả những hoạt động đó sẽ góp phần tạo nên thành công cho các dự án trong tương lai của bạn. Một số trang web Khoa học dữ liệu được đề xuất là: Data Science Central, KDnuggets, Revolution Analytics

Nguyên tắc 5: Thống nhất Tầm nhìn Khoa học Dữ liệu của Tổ chức 

Ngay từ ngày đầu tiên của quy trình khoa học dữ liệu, các nhóm khoa học dữ liệu nên tương tác với các đối tác kinh doanh. Các nhà khoa học dữ liệu và các đối tác kinh doanh thường xuyên liên lạc với nhau về giải pháp. Các đối tác kinh doanh muốn tránh xa các chi tiết kỹ thuật và các nhà khoa học dữ liệu của doanh nghiệp cũng vậy. Tuy nhiên, điều rất cần thiết là duy trì sự tương tác liên tục để hiểu việc thực hiện mô hình song song với việc xây dựng mô hình. Hầu hết các tổ chức đấu tranh áp dụng khoa học dữ liệu để tối ưu hóa quy trình hoạt động của họ và buộc các nhà khoa học dữ liệu, nhà phân tích và nhóm kinh doanh nói cùng một ngôn ngữ: các nhóm khác nhau và quy trình khoa học dữ liệu thường là nguồn gốc của sự xung đột. Sự xung đột đó là điểm giao của tam giác khoa học dữ liệu mới và dựa trên sự điều hòa hài hòa giữa khoa học dữ liệu, hoạt động CNTT và hoạt động kinh doanh.

Để hoàn thành nhiệm vụ này với khách hàng của mình, chúng tôi đã thực hiện các bước sau:

  • Yêu cầu sự hỗ trợ của giám đốc điều hành cấp C để thực hiện tầm nhìn đó và thúc đẩy nó thông qua các bộ phận khác nhau của doanh nghiệp: Nơi có mục đích rõ ràng, tầm nhìn và sự tài trợ , hương vị của thành công ban đầu hoặc chiến thắng ban đầu thúc đẩy thử nghiệm và khám phá thêm, thường dẫn đến hiệu ứng domino của sự thay đổi tích cực.
  • Xây dựng văn hóa thử nghiệm: Ngay cả khi có mục đích rõ ràng, chỉ điều đó thường không dẫn đến chuyển đổi kinh doanh thành công. Một trở ngại quan trọng trong nhiều tổ chức là thực tế là nhân viên không được trao quyền đủ để mang lại sự thay đổi. Có một lực lượng lao động được trao quyền sẽ giúp thu hút nhân viên của bạn và khiến họ tích cực tham gia đóng góp cho mục tiêu chung.

Cho mọi người tham gia vào cuộc trò chuyện: Xây dựng sự đồng thuận sẽ xây dựng cơ chế hoạt động. Nếu các nhà khoa học dữ liệu làm việc trong các hầm chứa mà không có sự tham gia của những người khác, tổ chức sẽ thiếu tầm nhìn, giá trị và mục đích chung. Chính tầm nhìn chung của tổ chức và mục đích chung giữa nhiều nhóm sẽ tạo ra sự đồng tâm hiệp lực.

Nguyên tắc 6: Tạo ra văn hóa data 

Trở thành một công ty dựa trên dữ liệu hướng đến sự thay đổi văn hóa hơn là những con số: vì lý do này, điều quan trọng là phải để con người đánh giá kết quả từ bất kỳ giải pháp khoa học dữ liệu nào. Việc hợp tác giữa khoa học dữ liệu và con người sẽ mang lại kết quả tốt hơn so với việc chỉ cung cấp một cách đơn lẻ.

Ví dụ: trong trường hợp khách hàng của chúng tôi, việc sử dụng kết hợp khoa học dữ liệu và kinh nghiệm của con người đã giúp họ xây dựng, triển khai và duy trì giải pháp đề xuất vị trí nhân lực đề xuất thành phần nhân viên tối ưu và từng nhân viên có kinh nghiệm và chuyên môn phù hợp cho các dự án mới, điều này thường dẫn đến lợi nhuận về tiền tệ. Sau khi chúng tôi triển khai giải pháp, khách hàng của chúng tôi đã quyết định tiến hành thử nghiệm với một vài nhóm dự án. Họ cũng tạo ra một nhóm v-Team gồm các nhà khoa học dữ liệu và chuyên gia kinh doanh với mục đích làm việc song song với giải pháp học máy và so sánh kết quả học máy về thời gian hoàn thành dự án, doanh thu tạo ra, nhân viên và sự hài lòng của khách hàng từ hai nhóm thí điểm này trước và sau khi sử dụng giải pháp của Azure Machine Learning. Đánh giá ngoại tuyến này được thực hiện bởi một nhóm dữ liệu và chuyên gia kinh doanh rất có lợi cho bản thân dự án vì hai lý do chính:

  1. Nó xác nhận rằng giải pháp học máy có thể cải thiện ~ 4/5% tỷ suất lợi nhuận đóng góp cho mỗi dự án;
  2. Nhóm v đã có thể thử nghiệm giải pháp và tạo ra một cơ chế phản hồi tức thì vững chắc cho phép họ liên tục theo dõi kết quả và cải thiện giải pháp cuối cùng.

Sau dự án thử nghiệm này, khách hàng đã tích hợp thành công giải pháp của chúng tôi trong hệ thống quản lý dự án nội bộ của họ.

Có một số nguyên tắc mà các công ty nên ghi nhớ khi bắt đầu sự thay đổi văn hóa theo hướng dữ liệu này:

  • Làm việc song song: các công ty hàng đầu ngày càng nhận ra rằng những công nghệ này hiệu quả nhất khi chúng bổ sung cho con người chứ không phải thay thế chúng. Hiểu được các khả năng độc đáo mà khoa học dữ liệu và con người mang lại cho các loại công việc và nhiệm vụ khác nhau sẽ rất quan trọng khi trọng tâm chuyển từ tự động hóa sang thiết kế lại công việc.
  • Nhận biết sự tiếp xúc của con người: Điều quan trọng cần nhớ là ngay cả những công việc có mức độ tin học hóa cao hơn cũng phải duy trì khía cạnh hướng đến dịch vụ và có tính diễn giải để mang lại thành công cho công ty – những vai trò này, giống như nhà khoa học và nhà phát triển dữ liệu, vẫn cần thiết kỹ năng sáng tạo, đồng cảm, giao tiếp và giải quyết vấn đề phức tạp của con người.
  • Đầu tư vào phát triển lực lượng lao động: Trọng tâm đổi mới, giàu trí tưởng tượng vào phát triển lực lượng lao động, mô hình học tập và nghề nghiệp cũng sẽ rất quan trọng. Có lẽ quan trọng nhất của tất cả sẽ là nhu cầu tạo ra những công việc có ý nghĩa – công việc mà dù có sự hợp tác mới với các máy móc thông minh, con người vẫn sẽ háo hức đón nhận.

Thành phần con người sẽ đặc biệt quan trọng trong các trường hợp sử dụng mà khoa học dữ liệu sẽ cần bổ sung, những kiến ​​trúc hiện đang rất đắt tiền, chẳng hạn như biểu đồ tri thức rộng lớn, để cung cấp ngữ cảnh và thay thế trải nghiệm của con người trong mỗi lĩnh vực.

Kết luận

Bằng cách áp dụng sáu nguyên tắc này từ Khuôn khổ của Tổ chức Khoa học Dữ liệu bài bản vào quá trình phân tích dữ liệu, các tổ chức có thể đưa ra quyết định tốt hơn cho doanh nghiệp của họ, lựa chọn của họ sẽ được hỗ trợ bởi dữ liệu đã được thu thập và phân tích một cách hiệu quả.

Khách hàng của chúng tôi đã có thể triển khai một giải pháp khoa học dữ liệu thành công, đề xuất thành phần nhân viên tối ưu và nhân viên cá nhân có kinh nghiệm và chuyên môn phù hợp cho các dự án mới. Bằng cách gắn kinh nghiệm của nhân viên với nhu cầu của dự án, chúng tôi giúp các nhà quản lý dự án thực hiện phân bổ nhân viên tốt hơn và nhanh hơn.

Với thực tiễn, các quy trình khoa học dữ liệu sẽ nhanh hơn và chính xác hơn – có nghĩa là các tổ chức sẽ đưa ra các quyết định tốt hơn, sáng suốt hơn để điều hành hoạt động hiệu quả nhất.

Dưới đây là một số tài nguyên hữu ích bổ sung để tìm hiểu thêm về cách nuôi dưỡng tư duy khoa học dữ liệu lành mạnh và xây dựng một tổ chức theo hướng dữ liệu thành công:

Xây dựng Data Warehouse

Dịch vụ xây dựng Data Warehouse theo yêu cầu cho doanh nghiệp của MiEdu

Các điểm nổi bật của dịch vụ tại MiEdu:

  1. Thiết kế và xây dựng từ A đến Z theo nhu cầu của từng doanh nghiệp.
  2. Cung cấp đội ngũ training, bảo trì hệ thống sau khi xây dựng DWH tại doanh nghiệp.
  3. Thiết kế DWH có tính scalable, có thể ứng dụng các công nghệ AI khi muốn phát triển các sản phẩm, dịch vụ tại doanh nghiệp.
Nguồn bài viết: The Data Science Mindset: Six Principles to Build Healthy Data-Driven Organizations

Biên dịch và biên tập: Mary

Bài viết có hữu ích không?

Các bài viết liên quan

how to see who likes you on tinder review

ten. Allow her to generate have confidence in you

love ru sign in

18 Wedding Class Games Your guests Would like

militarycupid-recenze Seznamka

six. Sign-up online dating sites and you can qualities one to target rich website subscribers

Escort escort orlando

Do not get myself wrong; I'm an individual guy who's towards the matchmaking

adventure-dating-nl MOBIELE SITE

There is no better method to finish your day instead of sharing that it meme gif with your loved ones?

fastflirting Zaloguj si?

The working platform are right for small hookups

puerto-rico-chat-rooms dating

Ways to get an effective screenwriting broker and you can manager action six: choose wisely

sites-de-rencontre-mexicains avis

Paree list acquisition habitation 2021 — au Top 10+ demande a placer quand d’achat d’une logement

quickflirt kosten

Lass mich daruber erzahlen ruhen Eltern, entsprechend Die leser man sagt, sie seien, Jedoch befinden Die Kunden, entsprechend Eltern schuften

writers-dating dating

Amid all this, Ghanaian ladies are nonetheless thought to be beautiful and you will classic

hot or not Zaloguj si?

Mom Necklace, Mother-in-laws Necklace, On my Date’s Mommy Necklace, Current To possess Boyfriend’s Mom Mommy’s Time

girlsdateforfree mobile site

Relationships versus. Relationships: 15 Differences You have to know In the

dating-in-spanish mobile site

Think about, when you ask some body out, it's the start of exactly what will possibly feel a committed relationship

politische-dating-sites kosten

Lass mich daruber erzahlen genau so wie verknallen einander frauen

Bình luận của bạn

© Copyright 2021 - Công ty Đào tạo và Hướng nghiệp thông minh Miedu

Sign Up and Start Learning

Hạn sử dụng đến 20/01/2022

TÌM HIỂU khóa
Full Stack data Science
-30%

Bảo hành học tập trọn đời cho người chuyển đổi công việc!