ANTS
 22/03/2016

Ad Fraud – Muôn Mặt Gian Lận Trong Hệ Sinh Thái Programmatic

Ad Fraud – Muôn Mặt Gian Lận Trong Hệ Sinh Thái Programmatic

Gian lận quảng cáo trong lĩnh vực Programmatic là một vấn đề then chốt thu hút sự quan tâm của nhiều Marketer hiện nay. Cơ chế mở cho phép các Advertiser và Publisher bất kể quy mô đều có thể tham gia hệ sinh thái Programmatic, nhưng đồng thời cũng để lọt vào nhiều “tác nhân” xấu và làm giảm sút chất lượng của quảng cáo Programmatic.

Gian lận là yếu tố đầu tiên mà một Marketer phải giải quyết khi nhìn vào chất lượng tổng thể các chiến dịch quảng cáo. Đó là bước đầu tiên cơ bản trước khi cố gắng tối ưu hóa khả năng hiển thị hoặc an toàn thương hiệu, bởi vì nó sẽ gây tổn hại mọi thứ nếu không được kiểm soát.

Liên quan đến tầm ảnh hưởng của gian lận quảng cáo, AdExchanger phỏng đoán:

Hiệp hội quảng cáo Quốc gia (ANA) và nhà cung cấp giải pháp gian lận trong quảng cáo White Ops đã cộng tác thực hiện một nghiên cứu trong 60 ngày kiểm tra mức độ nghiêm trọng của bot. Nghiên cứu theo dõi 181 chiến dịch trong số 36 thành viên ANA (bao gồm Walmart, Johnson & Johnson và Kimberly-Clark) và xác định rằng bot tạo ra 23% tất cả các Impression video, 11% quảng cáo hiển thị và gây tổn thất lên đến 6.3 tỷ đô la trong năm 2015.

Những con số khá cao.

Dựa vào số liệu trên nền tảng của AdExchanger, gian lận có nhiều hình thức đa dạng tùy thuộc sàn giao dịch quảng cáo. Sàn kém chất lượng có tỷ lệ gian lận khoảng 25-50%, trong khi sàn uy tín thường có tỷ lệ nhỏ hơn 10%.

Tuy nhiên, hầu hết các cuộc thảo luận trong ngành về gian lận chỉ điểm sơ qua và thường kết gộp chung các vấn đề khác nhau dưới tên gọi “gian lận”. Chỉ có những giải thích quá đơn giản và không nêu được các hình thái của Ad Fraud.

Dưới đây là định nghĩa của gian lận và những hình thức khác nhau của nó.

Định nghĩa gian lận

Thật ngạc nhiên khi có nhiều bất đồng và nhầm lẫn trong việc định nghĩa gian lận quảng cáo. Một trong những sai lầm lớn nhất đó là định nghĩa gian lận quảng cáo là traffic ảo (ví dụ bot – tức lượt truy cập không đến từ người dùng thực).

Mặc dù traffic ảo là đặc trưng và tiêu chuẩn để xác định gian lận quảng cáo, nhưng chỉ mình nó không phản ánh được toàn cảnh bức tranh Ad Fraud lớn hơn – đó là một tỷ lệ đáng kể của gian lận thực sự đến từ traffic thực (người dùng thực). Hay nói dễ hiểu – tất cả traffic từ robot chắc chắn là gian lận, nhưng không phải tất cả gian lận đều là traffic từ robot (giống như lửa thì nóng, nhưng không phải mọi thứ nóng đều là lửa).

Do vậy Ad Fraud mang một hoặc nhiều đặc điểm sau:

  • Traffic ảo
  • Không có cơ hội được nhìn thấy (khả năng hiển thị là 0%)
  • Cố tình bóp méo

 

Hầu hết các nỗ lực chống gian lận, và được quan tâm nhiều nhất, dường như chỉ tập trung vào traffic ảo. Nhưng gian lận còn vượt ra ngoài phạm vi bot. Nó cũng bao gồm các quảng cáo không có cơ hội được hiển thị trước mắt người dùng và nhiều quảng cáo bị các Publisher cố tình thay đổi.

Traffic ảo

Hầu hết traffic ảo được sử dụng để tạo ra số Impression (lượt xem) và nhấp chuột giả. Trong một số trường hợp, nó có thể tạo ra đăng nhập giả và chuyển đổi giả.

  • Bot đơn giản: bot đơn giản về cơ bản chỉ là script từ một máy chủ nào đó, như Amazon Web Services hoặc một số nhà cung cấp hosting khác. Vì đơn giản nên nó thường dễ xác định – bởi vì nó có một địa chỉ IP tĩnh, định danh người dùng, cookie,… – có thể phát hiện dấu vết và ngăn chặn chúng tương đối dễ dàng. Ví dụ với việc kiểm tra địa chỉ đăng nhập vào DSP đấu giá hay vào máy chủ Web mà các cú nhấp chuột xuất phát từ, chúng ta có thể phát hiện và ngăn chặn bot đơn giản khá dễ dàng bằng cách chặn tất cả các địa chỉ IP đã biết.
  • Bot tinh vi: bot tinh vi thì khác, sử dụng các chiến thuật như quay vòng định danh người dùng, sử dụng proxy ngẫu nhiên (để quay vòng các địa chỉ IP), giả tỷ lệ nhấp chuột bình thường, và trong một số trường hợp, thậm chí bắt chước chuyển động chuột thực. Tất cả những yếu tố này khiến cho việc phát hiện dấu vết và ngăn chặn khó khăn hơn.
  • Botnet: Botnet nói chung là một tập hợp nhiều máy tính cá nhân đã bị xâm nhập bởi các tác nhân xấu. Những tác nhân này có quyền kiểm soát máy, sử dụng chúng cho các nhiệm vụ như nạp và bấm vào các quảng cáo, tạo ra các Impression và nhấp chuột trông có vẻ hợp pháp nhưng thực ra là giả. Botnet khó phát hiện và ngăn chặn nhất nên có rủi ro bị các nhân tố xấu triển khai cao hơn.

 

Tuy nhiên, vì bot được lập trình, nó thường theo các kiểu mẫu có thể bị các chuyên gia phát hiện. Chúng cũng làm cho các tiêu đề hấp dẫn hơn, vì vậy thường được giới truyền thông đề cập nhiều hơn.

Traffic thực

Ngược lại, traffic thực có lẽ thậm chí còn nguy hiểm hơn vì người dùng cuối là thật, nhưng Imprsesion (và trong một số trường hợp, nhấp chuột) được tạo ra là lừa đảo. Vì họ là những con người thật nên các nhà cung cấp chỉ nhắm vào việc tìm kiếm bot sẽ rất khó phát hiện.

  • Quảng cáo vô hình – Invisible Ads: có một vài cách phổ biến mà các Publisher gian lận “ẩn” quảng cáo để phù hợp với tiêu chí “không có cơ hội được nhìn thấy” bởi người dùng. Đầu tiên là “chồng quảng cáo” hoặc “chồng Impression”, về cơ bản là ẩn một quảng cáo bên dưới quảng cáo khác. Trong trường hợp như vậy, Publisher đang tạo nhiều Impression cho một lần xem trang duy nhất, nhưng quảng cáo duy nhất có thể nhìn thấy nằm trên cùng. Tương tự, các iFrame không thể nhìn thấy là một cách khác cố ý ẩn quảng cáo. Bằng cách nạp quảng cáo trong các iFrame không thể thấy được (kích thước 1×1 pixel), một hoặc nhiều Impression được tạo ra mà không hề được nhìn thấy. Chiến thuật như vậy tương đối dễ dàng phát hiện bằng cách sử dụng các công cụ kiểm tra như Integral Ad Science hoặc Pixelate.
  • Chênh lệch giá – Arbitrage: một trong những hình thức ẩn và tinh vi nhất của gian lận traffic thực đó là hình thức chênh lệch giá. Nó có thể có nhiều hình dạng và ảnh hưởng đến nhiều định dạng, chẳng hạn như banner và video. Về bản chất, các tác nhân xấu mua traffic với một chi phí rất thấp và bán lại nó với giá cao gấp nhiều lần. Ví dụ, một nhà xuất bản có thể bán Inventory của họ với CPM trung bình 5 đô la nhưng có thể mua traffic đáng ngờ cho trang web với giá thấp hơn nhiều.
  • Domain khống – Domain Spoofing: Trong hệ sinh thái RTB (đấu thầu thời gian thực), các Publisher đôi khi được phép khai báo tên miền riêng và Site ID của mình. Nhà xuất bản lừa đảo sử dụng nó như một cơ hội để làm giả Inventory. Họ có thể tự nhận mình là huffingtonpost.com, nhưng nếu tìm hiểu kĩ bạn sẽ thấy tên miền thực sự chạy quảng cáo là khác. Trong nhiều trường hợp khác, tên miền chạy quảng cáo bị giả mạo trong yêu cầu dự thầu.
  • Nhóm trang – Site bundling: Site ID là cách định danh Inventory trong hệ sinh thái RTB. Mỗi Site ID liên quan đến một miền duy nhất. Nhưng trong thực tế, nhiều nhà xuất bản và sàn giao dịch quảng cáo thường gộp chung hết các tên miền vào một ID. Vì vậy, một nhà quảng cáo có thể nghĩ rằng họ đang mua abc.com nhưng cuối cùng quảng cáo lại hiển thị tại xyz.com. Thiết lập này xảy ra ở phía người bán, vì vậy nó nằm ngoài tầm kiểm soát của các nền tảng hỗ trợ người mua DSP. Đây là một dạng “cố ý bóp méo” hàng hóa quảng cáo.
  • Chèn quảng cáo – Ad Injection: là kết quả của các thanh công cụ trình duyệt và phần mềm quảng cáo nhúng (plug-in) khác, quảng cáo có thể được chèn vào trang web bất kỳ, thường người sử dụng hoặc Publisher không nhận thấy. Điều này tạo ra tình huống: nơi không gian quảng cáo có thể hiển thị ví dụ như facebook.com nhưng không hề liên quan đến Inventory của Facebook. Cuối cùng, bất kỳ người sử dụng Facebook nào cũng có thể cho bạn biết rằng không có vị trí banner 300×250 hoặc 728×90 nào cả. Nhưng với việc chèn quảng cáo này, Inventory có thể được tạo ra trên các website lớn một cách dễ dàng.
  • Bơm Cookie – Cookie Stuffing: Bơm cookie không có gì mới với thế giới quảng cáo trực tuyến. Đã có một số trường hợp việc bơm cookie được sử dụng để tối đa hóa doanh thu liên kết. Hiện nay cookie quan trọng vì đó là cơ chế mà qua đó một phần lớn hệ sinh thái Programmatic có thể nhắm mục tiêu khán giả. Và với nguồn traffic Internet rẻ tiền luôn sẵn có để mua, việc bơm cookie làm loãng hoặc bóp méo dữ liệu người dùng mục tiêu giờ trở nên đáng báo động. Đáng chú ý là bơm cookie có thể xảy ra với cả traffic thực và ảo, vì vậy về mặt kỹ thuật, nó có thể rơi vào một trong hai thể loại, và đôi khi cả hai.
  • Hệ thống trao đổi click – Click Farms: Có những chương trình mời gọi, thường giả danh như “làm việc tại gia” hoặc “kiếm tiền trực tuyến”, trả tiền cho người dùng thực sự để nhấp vào quảng cáo và thậm chí điền các mẫu đơn, kết quả đó là Impression, nhấp chuột và chuyển đổi vô giá trị. Vì đây là những người thực sự nên hầu hết các hãng phần mềm khó phát hiện những gian kế này, nhưng chúng chắc chắn đều là hoạt động gian lận.

Tóm lại

Sau khi đã hiểu hơn về các loại gian lận quảng cáo khác nhau và các hình thái của chúng, có một số câu hỏi quan trọng đặt ra:

  • Tại sao ngay từ đầu đã có quảng cáo gian lận?
  • Ai chịu trách nhiệm về gian lận quảng cáo?
  • Làm thế nào để Marketer tự bảo vệ mình chống lại gian lận?

 

Câu trả lời sẽ có trong các phần tiếp theo.

(Còn tiếp)

(Theo www.marketingland.com)

Related Posts