Xác định Tính cách, Giới tính và Độ tuổi người dùng Internet thông qua Truyền thông xã hội
Xác định Tính cách, Giới tính và Độ tuổi người dùng Internet thông qua ngôn từ trên Truyền thông xã hội.
Một trong những công nghệ nền tảng (#AdTech) quan trọng nhất của Quảng cáo trực tuyến là thuật toán & mô hình xử lý dữ liệu Ngôn ngữ tự nhiên (Natural Language Processing – NLP). Vào những năm đầu 2008 công nghệ hiển thị quảng cáo theo ngữ cảnh (Contextual Advertising) đã làm điên đảo thị trường quảng cáo trực tuyến toàn cầu với những cái tên AdSense, Yahoo! Bing Network Contextual Ads, Microsoft adCenter, Advertising.com.
Quảng cáo theo ngữ cảnh phần nào thay thế dần vai trò lên kế hoạch (Media Planning) nơi mà chiến dịch quảng cáo sẽ chạy. Lúc trước, đây là công việc của con người, tuy nhiên, với sự ra đời của quảng cáo theo ngữ cảnh thì việc phân tích tự động nhờ những thuật toán thông minh đã dần thay thế công việc này của con người (Media Planner).
Tóm lại sự ra đời của quảng cáo theo ngữ cảnh đã tác động rất lớn đến ngành công nghiệp quảng cáo trực tuyến. Nó mang lại hiệu quả cao hơn cho các chiến dịch quảng cáo, mang lại thu nhập nhiều hơn cho các Publisher và giảm độ phiền phức của quảng cáo cho người xem. Đây chính là điểm mạnh của các mạng quảng cáo trực tuyến (Ad Network), đặc biệt hơn thế nữa ngày hôm nay công nghệ NLP có thể giúp các hệ thống quảng cáo xác định được Tính cánh – Giới tính – Độ tuổi của người dùng Internet một cách chính xác mà ko cần bất kỳ thông tin tài khoản hay cá nhân của người dùng.
Mới đây các nhà khoa học ở University of Pennsylvania – Mỹ, University và University of Cambridge – Anh Quốc đã nghiên cứu thành công mô hình xử lý dữ liệu các nhóm từ vựng của người dùng trên các truyền thông xã hội (Social Media) để xác định với độ chính xác cao về Tính cách – Giới tính – Độ tuổi của người dùng Internet. Mô hình đã phân tích hơn 700 triệu từ, cụm từ và các chủ đề thu thập từ các thông điệp Facebook của 75.000 tình nguyện viên đạt tiêu chuẩn qua kiểm tra tính cách. Thuật toán tìm ra các biến thể nổi bật trong ngôn ngữ và kết hợp các mô hình phân tích tâm lý học xã hội để phân biệt tính cách, giới tính và độ tuổi người dùng.
Dưới đây là một số hình ảnh về mô hình xử lý dữ liệu và bài báo cáo khoa học của mô hình:
(Theo PLOS)