Cựu Giám đốc điều hành Google Eric Schmidt đã có một nhận xét nổi tiếng vào năm 2010 rằng lượng thông tin do con người tạo ra cứ sau hai ngày tương đương với tất cả thông tin được tạo ra trong suốt lịch sử cho đến năm 2003. Vào thời điểm đó, điện thoại thông minh và phương tiện truyền thông xã hội vẫn còn ở giai đoạn đầu, nghĩa là tầm quan trọng của chúng. việc tạo dữ liệu chỉ được tăng cường kể từ đó.
Các doanh nghiệp có thể thu thập và sử dụng dữ liệu này một cách hiệu quả có thể trích xuất những hiểu biết vô giá về đối tượng và thị trường của họ. Đây là lúc quản lý vòng đời dữ liệu (DLM) xuất hiện—một khuôn khổ có thể mang lại mục đích, cấu trúc và bảo mật cho dữ liệu của bạn. Đây là cách để bắt đầu.
Vòng đời dữ liệu là gì?
Vòng đời dữ liệu là chuỗi các giai đoạn mà dữ liệu trải qua, từ khi tạo ra đến khi xử lý cuối cùng, bao gồm toàn bộ vòng đời của dữ liệu trong một tổ chức hoặc hệ thống. Đổi lại, quản lý vòng đời dữ liệu (DLM) là cách quản lý thích hợp vòng đời này.
Mặc dù mỗi phần dữ liệu đi theo một đường tuyến tính từ khi tạo đến khi hủy, nhưng vòng đời của dữ liệu—như tên cho thấy—là theo chu kỳ. Các giai đoạn khác nhau có thể trùng lặp hoặc xảy ra lặp đi lặp lại tùy thuộc vào dữ liệu cũng như các yêu cầu và bối cảnh cụ thể của tổ chức.
Quản lý vòng đời dữ liệu có thể:
- Hợp lý hóa các quy trình. Quản lý vòng đời dữ liệu làm cho dữ liệu trở nên hữu ích hơn trong các chức năng của tổ chức, từ tiếp thị đến nhân sự đến C-suite. Nó cũng cung cấp các hướng dẫn rõ ràng để xử lý, lưu trữ và xóa dữ liệu, hợp lý hóa các quyết định vận hành.
- Nâng cao khả năng sử dụng dữ liệu. Quản lý vòng đời dữ liệu xác định mục đích rõ ràng cho việc thu thập dữ liệu, do đó bạn chỉ thu thập dữ liệu có liên quan.
- Tăng cường bảo mật. Các doanh nghiệp phải bảo vệ thông tin họ thu thập khỏi tin tặc và các hành vi vi phạm an ninh khác. Bạn có thể xây dựng bảo mật cho các quy trình của tổ chức mình bằng cách xác định rõ ràng các phương pháp hay nhất cho từng bước trong vòng đời của dữ liệu.
- Kiểm soát chi phí. DLM giúp xác định khi nào dữ liệu không còn giá trị đối với công ty bằng cách đặt các mốc thời gian và tiêu chí đánh giá khả năng sử dụng. Khi dữ liệu đã vượt qua các ngưỡng này, bạn có thể chuyển dữ liệu sang bộ nhớ ít tốn kém hơn hoặc xóa dữ liệu đó.
5 giai đoạn của vòng đời dữ liệu
- Tạo dữ liệu
- Xử lý và lưu trữ dữ liệu
- Sử dụng dữ liệu
- lưu trữ dữ liệu
- hủy dữ liệu
Quy trình vòng đời dữ liệu thường tuân theo khuôn khổ năm bước:
1. Tạo dữ liệu
Tạo dữ liệu là giai đoạn bạn tạo hoặc lấy dữ liệu từ nhiều nguồn khác nhau: phân tích trang web, ứng dụng, mục nhập dữ liệu biểu mẫu, khảo sát, nhà cung cấp bên thứ ba, cảm biến, v.v.
Mọi giao dịch mua, bán, thuê, giao tiếp và tương tác trực tuyến đều có thể là nguồn dữ liệu có thể ở các định dạng khác nhau, chẳng hạn như có cấu trúc (cơ sở dữ liệu), bán cấu trúc (tệp XML) hoặc không có cấu trúc (tài liệu văn bản). Mặc dù việc giữ lại mọi thứ có thể rất hấp dẫn, nhưng điều quan trọng là phải ưu tiên đầu vào dựa trên chất lượng (dữ liệu đáng tin cậy và phức tạp đến mức nào?) và mức độ liên quan (dữ liệu đó hữu ích như thế nào đối với công ty của chúng ta?). Lọc ra dữ liệu không sử dụng được sẽ giúp bạn tạo một tập dữ liệu dễ quản lý hơn với chi phí lưu trữ rẻ hơn.
2. Xử lý và lưu trữ dữ liệu
Sau khi bạn tạo hoặc thu thập dữ liệu thô, đã đến lúc làm sạch và chuyển đổi dữ liệu đó. Điều này chuẩn bị cho việc phân tích trong bước tiếp theo.
Làm sạch dữ liệu có nghĩa là đảm bảo các phần dữ liệu khác nhau hoạt động cùng nhau, tương quan với nhau và được dịch thành các đơn vị giống nhau. Ví dụ: trong một trường đối chiếu giá, các ký hiệu đô la không liên quan phải được xóa và các loại tiền tệ phải được dịch một cách thích hợp. Làm sạch dữ liệu cũng có nghĩa là loại bỏ các mục nhập giả và sai có thể làm sai lệch dữ liệu. Kết quả là một cơ sở dữ liệu có thể sử dụng, dữ liệu đã được xác minh.
Sau đó, cơ sở dữ liệu phải được mã hóa (nghĩa là được chuyển đổi để chỉ các bên nội bộ mới có thể đọc được) để bảo vệ cơ sở dữ liệu khỏi các tác nhân xấu và đảm bảo tính bảo mật của dữ liệu. Sau khi được mã hóa, dữ liệu được lưu trữ trong khi chờ sử dụng.
Định dạng lưu trữ chính xác của dữ liệu doanh nghiệp phụ thuộc vào quy mô doanh nghiệp của bạn. Các tùy chọn bao gồm lưu trữ tại chỗ (máy chủ được đặt trong trang web thực của công ty), lưu trữ đám mây (sử dụng máy chủ từ xa) và lưu trữ đối tượng (lý tưởng cho dữ liệu phi cấu trúc).
Xây dựng một số dự phòng trong phương pháp lưu trữ dữ liệu của bạn bằng cách giữ bản sao lưu vật lý tại chỗ hoặc bản sao lưu trên đám mây.
3. Sử dụng dữ liệu
Trong giai đoạn này—một trong những phần thú vị hơn của toàn bộ vòng đời dữ liệu—bạn phân tích dữ liệu của mình để trích xuất thông tin có giá trị, khám phá các mẫu, xác định xu hướng hoặc đưa ra quyết định sáng suốt. (Người dùng Shopify Plus có thể thực hiện nhiều công việc này tại một chỗ thông qua ShopifyQL Notebooks, một công cụ phân tích và khám phá dữ liệu mạnh mẽ có thể được sử dụng trực tiếp từ quản trị viên.)
Ví dụ: bạn có thể biến dữ liệu thành hình ảnh trực quan hoặc bảng điều khiển mà người dùng cuối có thể sử dụng dễ dàng hơn. Máy học và trí tuệ nhân tạo có thể hỗ trợ rất nhiều trong việc phân tích dữ liệu, tạo ra thông tin chuyên sâu và chia sẻ dữ liệu. Trong thời đại dữ liệu ngày càng tăng, việc truy cập dữ liệu từ trên xuống (khi nó chỉ dành cho một số người dùng được chọn) có thể tạo ra tắc nghẽn. Các nhóm khác, chẳng hạn như tình báo tiếp thị và dịch vụ khách hàng, xếp hàng khi họ chờ nhóm nhỏ cấp quyền truy cập trong từng trường hợp cụ thể.
Thay vào đó, hãy dành thời gian thiết kế quy trình công việc đảm bảo mức độ hiển thị phù hợp cho người dùng trên các cấp và chức năng. Có lẽ tiếp thị cần quyền truy cập sẵn sàng vào việc sử dụng web và phân tích người dùng, nhưng dịch vụ khách hàng cần khả năng hiển thị đầy đủ để trả lại. Cân nhắc xuất bản dữ liệu dưới dạng hỗ trợ cho các nỗ lực tiếp thị hoặc nghiên cứu điển hình.
4. Lưu trữ dữ liệu
Dữ liệu đã hoàn thành mục đích trước mắt vẫn có thể cần được giữ lại vì lý do pháp lý, quy định hoặc lịch sử. Lưu trữ dữ liệu liên quan đến việc lưu trữ dữ liệu trong kho lưu trữ hoặc bản sao lưu dài hạn, đảm bảo tính toàn vẹn, bảo mật và khả năng truy cập của dữ liệu để tham khảo trong tương lai.
Thay vì xóa dữ liệu của bạn ngay lập tức, việc giữ lại dữ liệu lưu trữ đảm bảo rằng dữ liệu vẫn có sẵn trong một khoảng thời gian sau khi sử dụng tích cực. Có lẽ tiếp thị xác định rằng các sáng kiến giữ chân khách hàng yêu cầu truy cập và sử dụng dữ liệu trực tiếp lâu hơn. Lưu ý rằng kiện tụng cũng có thể yêu cầu truy xuất dữ liệu.
5. Tiêu hủy dữ liệu
Khi bạn không cần dữ liệu lưu trữ nữa, hãy xóa vĩnh viễn dữ liệu đó để ngăn chặn truy cập trái phép hoặc vi phạm dữ liệu. Việc hủy dữ liệu lưu trữ cũng tạo thêm không gian lưu trữ cho dữ liệu đang hoạt động, giúp giảm chi phí lưu trữ.
Nhiều ngành có các quy định cụ thể quản lý việc xử lý dữ liệu, chẳng hạn như Đạo luật về trách nhiệm giải trình và cung cấp thông tin bảo hiểm y tế (HIPAA) trong lĩnh vực chăm sóc sức khỏe, những quy định này phải được tuân thủ chặt chẽ để tránh bị phạt về mặt pháp lý và tài chính. Việc triển khai các quy trình hủy dữ liệu chính xác và được ghi chép đầy đủ trong khuôn khổ tổ chức giúp loại bỏ sự không chắc chắn về việc quản lý dữ liệu phù hợp. Quản lý vòng đời dữ liệu liên quan đến việc đưa ra các quyết định quan trọng này ở cấp độ tổ chức thay vì đặc biệt.
Ở giai đoạn này, bạn có thể tinh chỉnh vòng đời khi thu thập thông tin chuyên sâu từ các trường và nguồn đầu vào, ảnh hưởng đến loại dữ liệu bạn thu thập và thời gian bạn lưu trữ dữ liệu đó. Phần cứng và không gian lưu trữ chứa đầy dữ liệu mới khi dữ liệu cũ di chuyển trong vòng đời.
Câu hỏi thường gặp về vòng đời dữ liệu
Một số thách thức tôi có thể gặp phải trong việc quản lý vòng đời dữ liệu là gì?
Một số thách thức trong việc quản lý vòng đời dữ liệu bao gồm đảm bảo chất lượng dữ liệu, bảo mật dữ liệu và quyền riêng tư, tích hợp dữ liệu cũng như các chính sách xóa và lưu giữ dữ liệu.
Làm cách nào tôi có thể đảm bảo tuân thủ quy định trong suốt vòng đời dữ liệu?
Để đảm bảo tuân thủ quy định trong suốt vòng đời dữ liệu, hãy hiểu các quy định và luật hiện hành, phân loại dữ liệu dựa trên mức độ nhạy cảm và tầm quan trọng của dữ liệu, thiết lập các chính sách lưu giữ và xử lý dữ liệu cũng như triển khai các biện pháp bảo mật như mã hóa.
Quản lý vòng đời dữ liệu khác với quản lý vòng đời thông tin như thế nào?
Quản lý vòng đời dữ liệu tập trung chủ yếu vào việc quản lý dữ liệu từ khi tạo đến khi loại bỏ, bao gồm lưu trữ, xử lý, sử dụng và lưu trữ. Ngược lại, quản lý vòng đời thông tin (ILM) là một khái niệm rộng hơn bao gồm dữ liệu và bối cảnh thông tin rộng hơn trong một tổ chức.