Machine Learning – Công Nghệ Khai Thác Tối Đa Giá Trị Big Data (Phần 1)
Song hành với sự bùng nổ của Big Data, các qui trình máy học (Machine learning) ngày càng đóng vai trò quan trọng trong việc đào sâu dữ liệu, xử lý thông tin phục vụ cho hoạt động tiếp thị. Vấn đề là Marketer làm thế nào tận dụng công nghệ này để mang đến các trải nghiệm được cá nhân hóa tối ưu cho người dùng Web.
Những năm gần đây cho thấy xu hướng bùng nổ đáng kinh ngạc về mặt nội dung Web. Theo đà này, Tập đoàn Dữ liệu Quốc tế IDC (International Data Corporation) dự đoán, vào năm 2020 vũ trụ số sẽ phình to gấp 300 lần hiện nay – dữ liệu tăng từ khoảng 130 tỷ GB hiện nay lên đến 40.000 tỷ GB. Tài sản thông tin trên Web sẽ đạt đến con số không thể tin được cùng với tiềm năng to lớn cho các hoạt động tiếp thị hiệu quả.
Nhưng có một vấn đề then chốt nảy sinh từ xu hướng dữ liệu lớn (còn gọi là “Big Data”) này – đó chính là não bộ của con người chỉ có thể lưu giữ nhiều nhất khoảng 1 triệu GB dữ liệu. Như vậy tầm cỡ to lớn của thế giới trực tuyến sắp tới đây có thể vượt quá sự kiểm soát và xử lý của não bộ. Marketer sẽ thấy được cơ hội tiếp cận với các thông tin cần thiết để chinh phục người dùng, nhưng sẽ không có khả năng xem xét thận trọng mọi dữ liệu để chắt lọc ra những thông tin tốt nhất phục vụ cho nhu cầu của mình.
Chính vì vậy ngành tiếp thị số cần đến những hệ thống quản trị và xử lý thông tin hiệu quả hơn – với khả năng mở rộng tương ứng để theo kịp qui mô khổng lồ của vũ trụ số sắp tới. Thuật ngữ Machine learning (máy học) bắt đầu được sử dụng phổ biến hơn bao giờ hết.
Hiểu đơn giản, Machine learning là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc phát triển các phương pháp kỹ thuật, cho phép máy móc “học” tự động từ dữ liệu để hỗ trợ con người giải quyết vấn đề nhanh chóng với một lượng thông tin khổng lồ phát sinh hàng ngày. Có thể nói động lực của Machine learning xuất phát từ nhu cầu thu nhận kiến thức ngày càng gia tăng trong khi nguồn lực con người đáp ứng cho nhu cầu này chỉ có giới hạn.
Để hiểu rõ vai trò ngày càng to lớn và ứng dụng rộng rãi của Machine learning, nên bắt đầu tìm hiểu từ hệ thống phân loại Internet từ những ngày đầu mới xuất hiện.
Machine learning gắn liền với quá trình phát triển Internet
Thực tế, Machine learning xuất hiện trước cả Internet, nhưng chỉ dưới dạng những thuật toán cơ bản giúp phân loại thư rác (thuật toán Perceptron). Dần dần khi Internet ra đời và có những bước tiến mới, Machine learning mới phát triển song hành và ngày càng hoàn thiện hơn.
Từ khi Internet ra đời vào những năm 1970, lượng thông tin con người tích lũy được cũng không phải là nhỏ. Tuy nhiên lúc ấy chúng ta không biết làm gì với đống dữ liệu này ngoài việc chép và lưu trữ. Mãi cho đến khi Internet phát triển, ngày càng có nhiều kết nối, cùng với sự xuất hiện của mạng xã hội khiến nhu cầu chia sẻ thông tin tăng trưởng chóng mặt, các nhà khoa học mới nhận ra rằng đằng sau những dữ liệu khổng lồ này là lượng tri thức vô giá. Đó là lúc “Big Data” chính thức ra đời.
Lúc này, để hiểu được giá trị ẩn chứa trong Big Data cũng như khai thác chúng trên qui mô lớn, con người cần đến những tài nguyên công nghệ – mà mấu chốt chính là Machine learning.
Còn nhớ sự ra đời của Yahoo (năm 1994) như một website phục vụ tìm kiếm những trang Web hay hoặc các thông tin hữu ích,… – những nhu cầu đang rất phổ biến trong giai đoạn này. Thành công của Yahoo dựa trên hoạt động đeo bám trang, lưu lại các địa chỉ được yêu thích này dưới dạng các danh mục đặc trưng mà sau đó được sử dụng để cung cấp thông tin cho người dùng đang tìm kiếm.
Tuy nhiên khi Internet bắt đầu phát triển, hệ thống này nhanh chóng bộc lộ tính không hiệu quả. Đơn giản vì nó quá thủ công nên không thể mở rộng, nâng cấp thêm nữa.
Lúc này, Google dần nổi lên và thống trị nhờ sức sáng tạo trong việc hiểu về các website. Thông qua việc không ngừng phát triển các thuật toán Machine learning, Google đã tạo ra một hệ thống chuyên thu thập, phân tích về những ‘dự định’ và ‘giá trị’ của website. Quá trình này tập trung vào các tiêu chí ‘có bao nhiêu lượt traffic đến từ liên kết ngoài’ hay ‘loại từ khóa nào có giá trị gắn kết với trang nội dung cao nhất’,…
Theo bước phát triển của Web, tiềm năng của Machine learning không còn là câu hỏi mà đã trở thành thực tế và gây kinh ngạc cho Marketer vì những giá trị to lớn nó mang lại trong khả năng thu thập, phân tích dữ liệu và tạo nên những trải nghiệm được cá nhân hóa cho người dùng Web. Nhưng cần phải nhìn nhận đúng đắn rằng Machine learning chỉ là một công cụ đầy sức mạnh hỗ trợ cho hoạt động tiếp thị quảng cáo, chứ không phải “liều thuốc trị bách bệnh” khiến Marketer để mặc mọi vấn đề cho máy tính và các thuật toán xử lý.
Machine learning và vai trò của con người
Dù một hệ thống có trở nên tiên tiến về mặt công nghệ như thế nào đi nữa, nó vẫn không bao giờ có thể thay thế được con người.
Máy móc có sức mạnh trong việc tìm kiếm những mẫu hình liên quan đến hành vi khách hàng, có thể nắm bắt tín hiệu dự định hoặc dự báo hành vi, nhưng lại không thể viết một bài báo giúp tạo động lực thúc đẩy người tiêu dùng mua sắm. Nó có thể tiết lộ thứ khách hàng mục tiêu muốn đọc nhưng lại không thể tạo nên chính những nội dung này.
Cũng vậy, vai trò của Machine learning chính là cung cấp cho Marketer những hiểu biết chuyên sâu họ cần để tối ưu hóa việc sản xuất nội dung. Còn lĩnh vực sáng tạo thuộc về trách nhiệm của con người.
(Theo www.marketingland.com)