29/05/2020
Lic. Miguel Ángel Dobrich (Amenaza Roboto)
Diplomatura de Gobernanza en Internet
Centro de Estudios de Tecnología y Sociedad, Universidad de San Andrés
Instituto de Informática, Universidad Federal do Rio Grande do Sul
ABSTRACT
Según el informe de Nielsen Total Audience Report1, en promedio, un usuario de un servicio de video on demand por suscripción (SVOD) invierte 7 minutos buscando contenidos. En Netflix, esa búsqueda dista de ser “libre”: el 80 por ciento de las horas de visualización provienen de recomendaciones automatizadas. En ese contexto, cabe preguntarse: ¿en qué medida tienen control los usuarios de sus propias acciones? ¿Con qué criterios el equipo de Netflix estructura sus algoritmos de recomendaciones? ¿Qué variables consideran para personalizar? ¿Cómo repercute la UX en el minado de datos de los usuarios de Netflix? Y, por último, ¿cómo repercuten los algoritmos y los datos recabados en la compra y producción de contendidos de LATAM?
Producto, Algoritmos y TV por Internet
“Having only a vague notion of how algorithms function is no longer sufficient for responsible citizens, consumers, and professionals”
Kartik Hosanagar, autor de «A human guide for artificial intelligence»
Como se afirma en “The Netflix Recommender System: Algorithms, Business Value, and Innovation”2 , Netflix se encuentra en la intersección de Internet y la narración de historias. La compañía está “inventando la Televisión por Internet”3. Su principal producto y fuente de ingresos es un servicio de suscripción que permite a los usuarios ver cualquier contenido audiovisual del catálogo en cualquier momento, en una amplia gama de dispositivos conectados a Internet (o con capacidad para conectarse, ya que también se pueden descargar los Netflix Originals para ver offline).
Netflix quiere ser la nueva TV, no un mero servicio para acceder a contenidos, y sus ingresos y su posibilidad de crecimiento dependerán de sumar y retener suscriptores. Netflix compite con todo lo que robe atención: videojuegos, redes sociales y otras plataformas de AVOD y SVOD.
“Un pilar clave de nuestro producto es el sistema de recomendación que ayuda a nuestros miembros a encontrar videos para ver en cada sesión. Nuestro sistema de recomendación no es un algoritmo, sino más bien una colección de algoritmos diferentes que sirven diferentes casos de uso que vienen juntos para crear la experiencia completa de Netflix”
Carlos Gómez-Uribe, ex Director de Innovaciones, y Neil Hunt, ex Chief Product Officer de Netflix
En el Netflix TechBlog se afirma que “La experiencia de Netflix está impulsada por una serie de algoritmos de Machine Learning: clasificación personalizada, generación de páginas, búsqueda, similitud, calificaciones, etc.”4. Netflix es una compañía que busca de manera constante mejorar la experiencia del usuario, optimizar la calidad del video según la capacidad de conexión de los suscriptores, tomar mejores decisiones en torno a la adquisición o producción de contenido, ofrecer el contenido adecuado al usuario específico, subir el tráfico de esos videos y, a consecuencia de la sumatoria de lo descrito, fidelizar a sus clientes. En todos esos aspectos son esenciales los equipos de ingenieros y data scientists.
Todas las mejoras de la plataforma y la app de Netflix pasan por rigurosos procesos de A/B testing5 y, en consecuencia, los usuarios son minados de múltiples maneras.
En WeAreNetflix, el podcast institucional de la compañía, hay un episodio titulado “Machine Learning Infrastructure At Netflix”. Allí se entrevista a Faisal Siddiqi (Engineering Manager, Personalization) y Julie Pitt (Director of Machine Learning Infrastructure). En el programa se afirma que “mucho de lo que se hace en Machine Learning6. Pero mucho de lo que sucede detrás de la escena es simplemente buena ingeniería de software7.
Los modelos de recomendación de Netflix se basan en gran medida en los patrones de aprendizaje de los datos de reproducción, “en particular en lo que respecta a la coincidencia o secuencias de reproducciones entre videos”.
Como se sostuvo, Netflix customiza sus sugerencias a partir de los datos que consigue del tipo de perfil (adulto vs. “Kids”), los hábitos de consumo del usuario, el dispositivo que se utiliza para visualizar o descubrir contenidos y, efectivamente, mina a los usuarios partir de las decisiones que toman al interactuar con:
a) Portadas
Las portadas de series y películas rotan frecuentemente de manera automatizada. Ese proceso aumenta entre el 20% y el 30% del tráfico de los títulos8 y, por supuesto, la sumatoria de tipos de portadas que generan reproducciones -y las correlaciones que se establezcan entre ellas- sirven para personalizar el tipo de portadas que generarán tráfico a futuro.
Con el paso de los años, el catálogo de Netflix se ha reducido 2/3. Lo que ofrece la plataforma debe ser fácil de ubicar -y debe ser lo adecuado-. En promedio, una persona recorre, como si estuviera haciendo zapping, entre 40 y 50 títulos antes de escoger lo que quiere ver. Los diseñadores e ingenieros de Netflix notaron que la portada tradicional de Hollywood no era realmente la mejor manera de publicitar los videos de su catálogo. Según el director de producto de Netflix, Neil Hunt: “Si los consumidores no encuentran algo que ver durante esos primeros 90 segundos, pueden cerrar la aplicación por completo y decidir hacer otra cosa”9. Esto se manifiesta como un core value en el blog de la compañía: ”Nuestro objetivo es minimizar el tiempo de inicio de reproducción para los millones de miembros de Netflix en todo el mundo”10
b) Trailers
En la parte superior de la homepage de Netflix hay un avance o tráiler destacado en autoplay. Allí se mide si efectivamente se da play, si se suma el contenido a la lista personal y hasta si silencia ese clip o no.
Pero también se pueden ver microavances de todo lo que se ofrece a medida al posar el mouse sobre un título previamente en pausa, o en hileras como “Popular on Netflix”, “Trending Now”, “New Releases”, “Netflix Originals”, ad infinitum.
c) Avances y omisiones
¿El usuario “x” omite la presentación los créditos del contenido que ve? ¿Permite la reproducción automática del siguiente episodio de la serie que estaba viendo o no?
d) Rows/hileras/góndola/carrusel
La popularidad es lo opuesto de la personalización. Netflix mide cómo se interactúa con las hileras que propone. ¿Cambia la interacción si varía el orden de las hileras o el orden de los contenidos sugeridos? ¿Cuánto pesa en los hábitos de reproducción de la lista personal que arman los usuarios? Cada row trabaja con su propio algoritmo y, en teoría, cuanto más tiempo se utilice la plataforma mejor funcionarán las sugerencias personalizadas y se generarán mejores listas.
A ningún usuario se le mostrarán exactamente las mismas combinaciones de contenidos, pero Netflix ocasionalmente presentará nuevos programas y tipos de shows podrán interesar a usuarios particulares. Si se comienza a ver una serie pero no se llega al final del episodio, el algoritmo de Netflix hará que aparezca periódicamente el capítulo para estimular que se llegue al final del mismo.
Por último, según el horario de uso de la plataforma, Netflix puede ubicar hábitos de consumo mientras destaca determinado tipo de contenidos en las rows: en la noche se suele incrementar la sugerencia de contenidos más cortos y puede crecer la relevancia de la hilera de “continuar viendo”. Ir en con esas tendencias o en contra de ellas dirá mucho del usuario.
e) Orden de episodios
La serie de unitarios animados “Love Death + Robots” varía el orden de los episodios según el usuario pero, en paralelo, cada usuario puede ver la serie en el orden que desee. Es importante recordar que Netflix trabaja con grandes volúmenes de datos y, por lo tanto, puede encontrar correlaciones a partir de algo tan banal como eso.
f) Scoring
El usuario o la usuaria: ¿se toma la molestia de calificar? ¿Le da “dedo para arriba” o “para abajo” a lo que ve? ¿Qué títulos fueron calificados de modo positivo? ¿Cuáles de modo negativo?
g) Búsquedas
En el acto de la búsqueda, de ir por el search, se encuentran constantes en relación a géneros, films galardonados, directores, actores y obras afines al gusto de los usuarios. Allí Netflix presenta los videos más relevantes del catálogo, teniendo en cuenta la disponibilidad, es decir, las licencias de contenidos que varían según los mercados. El historial de búsqueda termina mejorando las categorías de las góndolas digitales y la relevancia de los títulos que se sugieren algorítmicamente.
En relación al lugar desde donde se da play, al país y la región, Netflix pone a prueba sus modelos e hipótesis, ya que uno de los “sesgos” o de las variables que impactan los algoritmos de sugerencia es lo que denominan como cultural awareness.
Desde el blog tecnológico de la compañía se admite que:
“Otro desafío clave para hacer que nuestros algoritmos funcionen bien en todo el mundo es garantizar que podamos capturar las variaciones locales del gusto (…) Para abordar estos desafíos, buscamos combinar los modelos regionales en un solo modelo global que también mejore las recomendaciones que hacemos, especialmente en países donde aún no tenemos muchos miembros (…) Esto lleva a la pregunta: ¿es el gusto local o el gusto personal más dominante? Según los datos que hemos visto hasta ahora, ambos aspectos son importantes, pero está claro que los patrones de sabor viajan a nivel mundial. Intuitivamente, esto tiene sentido: si a un miembro le gustan las películas de ciencia ficción, alguien del otro lado del mundo que también le guste la ciencia ficción sería una mejor fuente de recomendaciones que su vecino de al lado al que le gustan los documentales de comida. Poder descubrir comunidades de interés en todo el mundo significa que podemos mejorar aún más nuestras recomendaciones, especialmente para intereses de nicho, ya que se basarán en más datos. Luego, con un algoritmo global, podemos identificar patrones de gusto nuevos o diferentes que surgen con el tiempo”11.
El KPI, la métrica clave de Netflix, son las “horas por suscriptor por mes”. ¿Qué se sabe de los datos que manejan de sus audiencias? Poco y nada. Según una carta enviada a un comité del Parlamento del Reino Unido12, Netflix utiliza tres categorías, para analizar y compartir métricas con directores y productores:
I. Los “starters” (principiantes) son los hogares que miran dos minutos de un largometraje o un episodio de una serie.
II. Los ”watchers” (observadores), son los hogares que miran el 70% de una película o un episodio de una serie.
III. Los “completers” (finalizadores) son los hogares que miran el 90% de una película o temporada de una serie.
El audiovisual y la gobernanza de algoritmos
El 80% de las horas de visualización de Netflix provienen de recomendaciones automatizadas13. Hasta hace unos pocos años, se creía que la llegada de plataformas de video on demand a América Latina iba a nutrir a nuevos cines y que podía beneficiar a relatos regionales y locales14, a aquellas obras que no logran estar en los multiplex, un terreno dominado por el cine clásico hollywoodense que apunta básicamente a niños y adolescentes. Pero lo cierto es que, ya en 2018, las plataformas de SVOD como Amazon Prime Video y Netflix profundizaron en las desigualdades de distribuidores y exhibidores clásicos15.
Netflix no es una buena plataforma para óperas primas, ya que las coordenadas artísticas de las obras (directores, guionistas, productores, intérpretes) que compran se pierden en la categoría de Netflix Original16. Hasta 2018 un film de un realizador o una realizadora debutante y de Latinoamérica podía conseguir unos US$ 250 mil con la venta de los derechos en 9-10 mercados o podía adquirir un monto similar al salir de competir en festivales y ser adquirida por Netflix. Hoy esas cifras se han desplomado en el mercado del SVOD.
Cabe preguntarse si hay relación entre la caída de los precios de compra de contenidos latinoamericanos y cómo funcionan los algoritmos de recomendación de Netflix. Lo que la plataforma “marketinea” afecta la demanda y, en paralelo a eso, el valor de los contenidos que Netflix produce o compra se estima a partir de modelos predictivos, a partir de cómo funcionaron contenidos “similares” antes. ¿Qué sesgos hubo en juego en la distribución y exhibición de esos contenidos? Sería interesante comprender eso para definir si, por ejemplo, los algoritmos no están beneficiando injustamente los productos que se desarrollan en los estudios de Netflix en Estados Unidos o España, por poner un ejemplo, o si hay una serie de variables que no son las adecuadas para trabajar el sesgo de “cultural awareness”.
Siguiendo el modelo propuesto por Kartik Hosanagar en los “4 Pillars of an Algorithmic Bill of Rights”17, en el campo cultural, y en particular en la producción, distribución y exhibición de contenidos audiovisuales, quienes usan algoritmos o quienes se ven afectados por las decisiones tomadas por ellos deberían tener el derecho a acceder a una descripción de los datos utilizados para entrenarlos y se debería explicar cómo se recopilaron esos datos. Siguiendo en el campo de la transparencia, la ciudadanía y la industria audiovisual latinoamericana debe poder acceder a una explicación, en términos sencillos, sobre los procedimientos utilizados por los algoritmos.
Un punto esencial que plantea Hosangar y que debería ser incorporado en pro de una regulación sólida y justa de algoritmos vinculados al consumo cultural, es que quienes usen algoritmos o quienes se vean afectados por las decisiones que estos toman deben tener cierto nivel de control sobre la forma en que funcionan esos algoritmos: debe haber un ciclo de retroalimentación entre el usuario y el algoritmo. Tiene que incorporarse el feedback. En cuarto lugar, todos aquellos que usen algoritmos o que se vean afectados por las decisiones de los mismo deben tener la responsabilidad de ser conscientes de las consecuencias imprevistas de la toma de decisiones automatizadas.
Quisiera culminar sugiriendo un quinto punto. Considero necesario que se haga público la composición de los equipos que diseñan los algoritmos que terminan repercutiendo en las visualizaciones de contenidos audiovisuales. Que sea como la firma de los arquitectos y los ingenieros de las viejas casas. Como sociedad, se debería discutir qué variables deben ser públicas. Por lo pronto, hallo de interés saber sexo, edades y etnias de los equipos. ¿Estamos ante equipos mayoritariamente Wasps y masculinos? Como plantea Ricardo Baeza-Yates, científico de datos y computación chileno, pionero en las técnicas de recuperación de datos digitales a gran escala así como en tecnologías de búsqueda: los sesgos geográficos, lingüísticos y de género que pueden afectar la calidad de la información18.
Bibliografía consultada
Galloway, Scott. The Four: The Hidden DNA of Amazon, Apple, Facebook, and Google. Penguin Random House, New York, 2017.
Hosangar, Kartik. A Human’s Guide to Machine Intelligence: How Algorithms Are Shaping Our Lives and How We Can Stay in Control. Penguin Random House, New York, 2019.
Lee, Kai-Fu. AI Super Powers – China, Silicon Valley, And The New World Order. Houghton Miffkin Harcourt, Boston, 2018.
Lobato, Ramón. Netflix Nations – The Geography of Digital Distribution. New York University Press. New York, 2019.
O’Neil, Cathy. Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. Penguin Random House, New York, 2017.
Webb, Amy. The Big Nine: How the Tech Titans and Their Thinking Machines Could Warp Humanity. Hachetter Book Group, New York, 2017.
- http://global.shopnielsen.com/all/nielsen-total-audience-report-2019
- https://dl.acm.org/doi/abs/10.1145/2843948
Carlos A. Gomez-Uribe y Neil Hunt. 2015. The Netflix recommender system: Algorithms, business value, and innovation. ACM Trans. Manage. Inf. Syst. 6, 4, Article 13 (December 2015), 19 páginas. DOI: http://dx.doi.org/10.1145/2843948
”Recommending for the word”: https://medium.com/netflix-techblog/recommending-for-the-world-8da8cbcf051b. Consultado el 08.12.19.
Según Todd Yellin, el vicepresidente de producto de Netflix, se hacen 250 tests al año. «This is how Netflix’s secret recommendation system works» www.wired.co.uk/article/netflix-data-personalisation-watching. Consultado el 08.12.19.
- El deep learning o aprendizaje profundo es un método del Machine Learning que usa ciertos modelos denominados redes profundas, redes que simulan las neuronas, que son escalas a gran tamaño.
Se puede acceder a todo el catálogo del podcast por aquí http://weare.netflix.net/ o al episodio en particular desde YouTube: https://youtu.be/k2iM6GReN6Q?list=PL_S_WRR3d9p0dtnRYNAAd8tsLXH20qWi8
- ”It’s all about testing – The Netflix experimentation platform”: https://medium.com/netflix-techblog/its-all-a-bout-testing-the-netflix-experimentation-platform-4e1ca458c15. Consultado el 18.12.19
”This Simple Trick Helped Netflix Increase Video Viewing by More Than 20 Percent”: https://variety.com/2016/digital/news/netflix-ab-tests-image-optimization-trick-1201674325/. Consultado el 12.12.19.
”The Netflix Media Database”. https://medium.com/netflix-techblog/the-netflix-media-database-nmdb-9bf8e6d0944d. Consultado el 11.12.19. Traducción de Miguel Ángel Dobrich.
- ”Recommending for the World”: https://medium.com/netflix-techblog/recommending-for-the-world-8da8cbcf051b. Consultado el 11.12.19. Traducción de Miguel Ángel Dobrich.
La carta es parte de examen continuo que realiza la televisión pública del Reino Unido al mercado del VOD (video on demand) y el SVOD (video on demand por suscripción): http://data.parliament.uk/writtenevidence/committeeevidence.svc/evidencedocument/communications-committee/public-service-broadcasting-in-the-age-of-video-on-demand/written/104558.html. Consultado el 10.12.19.
- Hosanagar, Kartik. «Free Will in an Algorithmic World» https://onezero.medium.com/free-will-in-an-algorithmic-world-8d5acb550cb7. Consultado el 14.12.19.
- “La primera Netflix Original de Brasil”, Entrevista a Marcelo Galvao en No Toquen Nada: www.delsol.uy/notoquennada/dobrich/la-primera-pelicula-original-netflix-de-brasil. Consultado el 18.12.19.
Entrevista a Fernando Epstein en Montevideo No, podcast de Dobcast. https://soundcloud.com/dobcast/118-mvd-no-fernando-epstein. Consultado el 18.12.19.
Argentina y Brasil produjeron 6 Netflix Originals, cada uno, en 2019. El 18% de los Originals del año son en español.
- Introducing the 4 pillas of an algorithmic bill of rights https://www.linkedin.com/pulse/introducing-4-pillars-algorithmic-bill-rights-kartik-hosanagar/. Consultado el 19.11.19.
”Predicción y sesgo en la red” amenazaroboto.com/baezayates. Consultado el 18.12.19.