Big Data: Todo lo que Netflix sabe sobre nosotros y como lo usa



En la era del big data, la plataforma es también un enorme archivo que registra usos y costumbres de sus usuarios. Su sistema sabe cuándo y cómo la usamos y deduce cómo somos. Algo que sin duda puede ser material del guión de una serie.


Netflix sabe que, el 24 de octubre de 2015, alguien en mi casa dedicó buena parte de ese sábado a ver los primeros ocho capítulos de Lady, la vendedora de rosas, producida por RCN Televisión en Colombia. Netflix sabe que esa persona se conectó en un televisor LG Smart TV a las 9.07 de la mañana y que dejó de consumir la serie al filo de las siete de la tarde; en ese lapso se registraron cinco pausas con un total de 4 horas y 15 minutos.

Netflix sabe que, cuando en casa nos enganchamos con una serie de televisión, nuestro consumo es obsesivo, casi demente. Sabe que de lunes a viernes, religiosamente, encenderemos el televisor entre las 9 y las 10 de la noche y miraremos la pantalla de manera compulsiva hasta entrada la madrugada. Y sabe que los fines de semana el consumo será más desenfrenado, sobre todo el domingo. En nuestra cuenta en Netflix quedará el registro de las pausas que hagamos para recargar suministros de la cocina, para ir al baño o para cualquier otra cosa.




Breaking Bad fue una excepción. Y Netflix también lo sabe. Consumimos los 62 capítulos de la historia de Walter White y su imperio de drogas en Albuquerque en poco más de dos meses. En medio se colaron Match Point, de Woody Allen (2005); Brazil, de Terry Gilliam (1985); Esperanza, de Joon-ik Lee (2013), y la segunda temporada de Narcos. Netflix conoce que los cuatro perfiles de nuestra cuenta se conectan a través de la LG, un iPad Air 2, una tableta con Windows 8, un iPhone 6, un decodificador de Totalplay (el N7700V3) y, eventualmente, una consola Xbox de Microsoft y una computadora Mac de Apple con el navegador Chrome de Google.




Netflix sabe que el 3 de julio pasado escribí “caca” en el buscador, me sugirió The Adventures of Tintin y di clic para leer la información sobre esa película de Steven Spielberg de 2011.




Y yo sé lo que Netflix sabe de mí porque le solicité acceso a mis datos y metadatos de carácter personal al amparo de los derechos ARCO (acceso, rectificación, cancelación y oposición) garantizados por la Ley Federal de Protección de Datos Personales en Posesión de los Particulares. Presenté la solicitud el 24 de agosto pasado y, el 4 de octubre, recibí de parte de Netflix un documento PDF de 153 páginas con 2.485 líneas de información sobre mi forma de pago, los productos consumidos, el historial de búsquedas, las calificaciones que doy a los contenidos, los mensajes enviados por Netflix a mi cuenta de correo, los dispositivos utilizados para el consumo y las direcciones IP para la conexión.




En términos generales, Netflix cuenta con pocos datos personales del titular de la cuenta: nombre completo, correo electrónico y datos de facturación. El resto son metadatos, información que sólo funciona a partir de los datos de carácter personal; esta información, leída fuera de contexto, aporta poco. Por ejemplo, esta línea: “7/28/16 | 20:50 | 0:00:19 | La ventana indiscreta | N/A | ‘LG 2015 MTK Soc Smart TV’ | 0:00:19 | 0:00:00 | MX”. Pero en conjunto, estos metadatos son de muchísimo valor para perfilar las características individuales de un consumidor de Netflix.




De acuerdo con la agencia de medición de mercados Statista, el mercado del big data global en 2011 representó 7.600 millones de dólares; para 2016, la cifra casi se multiplicó por cuatro, para alcanzar los 27.300 millones de dólares. En un reporte de 2014, la Comisión de Comercio de Estados Unidos (FTC, por su sigla en inglés) presentó propuestas para regular el trabajo cada vez más extendido de las compañías dedicadas a producir bases de datos (data brokers) con información de carácter personal de los consumidores. Estas compañías realizan perfiles comerciales y mercadológicos que permiten identificar nuevos clientes, evaluar el nivel de riesgo crediticio o predecir patrones criminales.




En el caso de Netflix, según su aviso de privacidad, la información sólo se utiliza para determinar la zona geográfica desde la que se consume el contenido; ofrecer contenidos localizados y recomendaciones de títulos que podrían ser de interés de los consumidores; determinar al proveedor de los servicios de conexión a internet y las características del ancho de banda, y realizar servicios de comunicación entre Netflix y sus suscriptores.




866 contenidos por 1,88 pesos cada uno. En 15 meses de servicio se han visto desde mi cuenta 712 horas de contenidos audiovisuales. He pagado 1.635 pesos (109 pesos mensuales entre julio de 2015 y septiembre de 2016) y se han visto 866 productos audiovisuales, contando capítulos de series, películas, documentales y stand-ups. La reproducción de cada título ha costado 1,88 pesos, sin considerar el plan de datos con mi compañía de telecomunicaciones ni el consumo de electricidad en casa.




Se trata de buena parte de la información que Netflix recaba sobre uno de sus 83,27 millones de suscriptores en 190 países, un océano de información que permite realizar inferencias sobre hábitos, circunstancias y estados de ánimo de quienes producen las acciones susceptibles de convertirse en datos. “Cada vez que un miembro de Netflix comienza a reproducir una película o el episodio de una serie se crea una ‘vista’ en nuestro sistema de datos y se almacena una colección de eventos que describen las acciones relacionadas con esa vista”, escribieron Phillip Fisher-Ogden, Matt Zimmer, James Kojo y Jinhua Li en el blog de tecnología de Netflix (techblog.netflix.com) el 27 de enero del 2015. Cada día se visualizan en Netflix 125 millones de horas de contenido alrededor del mundo.




La empresa tiene un valor de capitalización bursátil de 54.300 millones de dólares, un monto que supera por 5 mil millones el acumulado de las televisoras y productoras Televisa (BMV: 16 mil millones de dólares), TV Azteca (BMV: 600 millones); Grupo Clarín (Merval: 3.500 millones); CBS (NYSE: 25.600) y AMC (NYSE: 3.600). Su negocio se basa en tres verticales fundamentales: un catálogo de contenido atractivo, propio y de terceros; un modelo de recomendación que incite al usuario a permanecer en la plataforma, y un sistema de análisis de big data que le permite conocer las preferencias de sus usuarios, generar sus productos de mercadotecnia y crear productos audiovisuales. En mayo de 2013 estrenó la cuarta temporada de Arrested Development a partir del análisis de las interacciones en Netflix de los fanáticos de la serie, que había dejado de producirse siete años antes.




“Sabemos lo que has reproducido, lo que has buscado o lo que has calificado, al mismo tiempo que sabemos la hora, el día y el dispositivo que utilizaste. Nosotros incluso registramos interacciones del usuario como la navegación o el desplazamiento sobre la interfaz. Toda la data es alimentada por distintos algoritmos, cada uno optimizado para diferentes propósitos. En un sentido amplio, la mayoría de nuestros algoritmos se basan en el supuesto de que patrones de visualización similares representan gustos similares de los usuarios. Y podemos utilizar el comportamiento de usuarios similares para inferir tus preferencias”, dijo Xavier Amatriain en 2013, cuando era director de ingeniería de Netflix, en una entrevista para la revista Wired.




Netflix tiene 1.500 ingenieros en Silicon Valley dedicados a probar funcionalidades y algoritmos todo el día. “Somos una organización de aprendizaje”, dijo Kari Pérez, directora de Comunicación de Netflix para América Latina: el equipo se dedica a realizar hipótesis de comportamientos de los usuarios para conseguir mejores recomendaciones y atraer más suscriptores. “La información producida por los usuarios es muy importante porque nosotros seguimos aprendiendo y seguimos mejorando gracias a esa relación directa con ellos. Podemos hacer decisiones rápidamente en cuanto a la tecnología y en cuanto al contenido”, dijo Pérez, entrevistada vía telefónica para comentar este artículo.


Rastreando sobre los datos de una sola cuenta, Netflix puede conocer el estado de ánimo o aventurar perfiles psicológicos de sus suscriptores; inferir si en la casa donde se consume hay niños o si algún miembro de la familia permaneció en casa un día particular o si se ha quedado sin trabajo.


Este ejercicio con una cuenta particular de Netflix muestra el volumen de datos que una compañía tecnológica puede recabar de sus usuarios. Es apenas un caso entre decenas de servicios de la economía digital que penetran cada vez más entre los consumidores, desde los clásicos Google o Facebook hasta WhatsApp, Uber, Airbnb y Rappi. Un caso de un mundo cada vez más globalizado y datificado.


Cómo 'House of Cards' se convirtió en un éxito mundial gracias a un algoritmo
Algoritmos y 'Big Data'. Así aplica Netflix sus herramientas de análisis para garantizar el éxito de sus inversiones multimillonarias
Kevin Spacey posa ante un retrato de Francis Underwood, su personaje en 'House of Cards'.


En febrero de 2013, Netflix rompió con los patrones establecidos. Estábamos habituados a que los capítulos de nuestras series favoritas llegaran con cuentagotas, manteniéndonos en vilo mientras esperábamos la siguiente dosis de ficción. Pero aquel mes, la plataforma liberó de una sola vez las trece primeras entregas de una producción que hoy forma parte de la lista de sus títulos más vistos: así, entre recelos, veía la luz 'House of Cards'.

Audiencia, medios de comunicación y profesionales del sector no paraban de darle vueltas: ¿por qué Netflix hacía semejante movimiento?

Ya fuera una estrategia para ganar suscriptores o para diferenciarse de las cadenas de televisión tradicionales, pronto se hizo evidente que habían acertado con su nuevo producto. En sólo un mes, la serie se había convertido en el contenido más popular del catálogo, tanto en Estados Unidos como en otros cuarenta países.

Los contenidos no los deciden diez personas sentadas en una mesa, sino los hábitos y el comportamiento de millones de espectadores

Desde principios de este año, el menú audiovisual de la plataforma —con más de 75 millones de suscriptores— está disponible en otras 130 naciones. Un paso que, según explicaba su director, Reed Hastings, durante el anuncio oficial en Las Vegas, ha supuesto “el nacimiento de una nueva cadena de televisión global”.

Pero, a diferencia de lo que ocurre en los canales tradicionales, en la empresa estadounidense “los contenidos no se deciden en base a la opinión de diez personas sentadas en torno a una mesa, sino fijándose en el comportamiento y hábitos de millones de espectadores”, explica a Teknautas Joshua Lynn, presidente y cofundador de Piedmont Media Research, una empresa que utiliza algoritmos para predecir el éxito de una película antes de su estreno.
(Flickr: Shardayy)

Por eso, la casi instantánea popularidad de 'House of Cards' no pilló a Netflix por sorpresa. Era la crónica de un éxito anunciado o, más bien, calculado.

Los datos que recoge la plataforma sobre los hábitos de los usuarios no sólo le sirven para personalizar las recomendaciones. Sus expertos en 'big data' los modelan hasta convertirlos en una especie de gafas para ver el futuro; unas lentes que les sirvieron para valorar si merecía la pena invertir millones de dólares en reinventar la versión británica de la serie.

“Saber lo que le gusta a los suscriptores es clave en nuestras decisiones sobre si adquirimos un contenido”, nos aseguran desde la empresa con sede en California. La información que han recopilado durante casi veinte años les permite “determinar los derechos de qué series y películas debemos comprar”.
Un secreto a voces

Aunque no han querido dar detalles sobre los modelos de 'machine learning' y variables que utilizan con este fin, lo cierto es que ya teníamos una idea acerca de los datos que recogen sus algoritmos: las valoraciones de los usuarios, las búsquedas que hacen en la plataforma, qué dispositivos utilizan, cuánto tiempo invierten diariamente en la web y en cada vídeo, qué día de la semana prefieren, si ven los capítulos enteros o parcialmente, las preferencias que tienen en común con sus amigos o la audiencia de su misma región geográfica son algunos de los elementos que se tienen en cuenta. Además de los metadatos sobre el actor, director y género de cada título.

Netflix lo sabe casi todo de sus usuarios: qué ven, cuándo, dónde, qué día de la semana o si ve un capítulo de una sentada o en varias tandas

“Queremos ofrecer contenidos exclusivos, que sólo puedan encontrarse en Netflix”, señalan sus responsables. Y si los datos se le dan tan bien, ¿por qué no convertirlos en una herramienta para conseguir ese catálogo original?

Con 'House of Cards' dieron el primer paso en un cambio de paradigma. “Éramos una compañía tecnológica y necesitábamos mucha educación creativa para adentrarnos en el mundo de la producción de entretenimiento”, aseguraba Dave Hastings, director de analítica de producto en Netflix, en una conferencia sobre 'big data' en Filadelfia.
Kevin Spacey mira a cámara en un plano de 'House of Cards'. (Netflix)

El mismísimo Kevin Spacey, protagonista de la serie, lo explicaba con más detalle sobre un escenario en Las Vegas. Probar suerte con el piloto de una serie “supone una pérdida de tiempo y dinero”, pero era el plan que les propusieron seguir con 'House of Cards' en todas las cadenas, excepto en Netflix. Allí les preguntaron cuántos episodios querían producir. “Y podían hacerlo con seguridad porque habían analizado su audiencia, sabían cómo respondería a un drama político, sabían que le gustaba el director David Fincher y sabían que la versión británica de la serie había sido un éxito”, argumentaba el actor.
Un gancho llamado David Fincher

El método predictivo de Piedmont Media Reseach se basa no sólo en la valoración de la idea de guión, sino también en la respuesta que provocan intérpretes y directores. “El nombre de David Fincher suele incrementar el interés por una película o serie”, confirma Lynn. “La gente sabe que es un director con talento y suele estar vinculado con buenos productos”.

Una vez fijado el punto de partida, era el turno del equipo creativo. “Les damos total libertad a los productores y artistas”, nos aclaran desde Netflix. “Es una mezcla de arte y ciencia”. Porque el 'big data' no lo es todo: “Siempre tiene que haber un equilibrio entre los números y la creatividad, que es la que define un buen resultado”, indica Lynn. “Beau Willimon [creador de 'House of Cards'] tiene talento, ha escrito guiones muy buenos”.


David Fincher, durante el rodaje de 'La Red Social'. (EFE)

Confiesa que le preguntan a menudo si los datos están frenando la creatividad o dejando de lado los proyectos más independientes. “Siempre ha habido un pulso entre la parte artística y los negocios”, asegura. Estudios, productoras y canales de televisión también se fijan en los proyectos que funcionan para buscar otros parecidos. “Por eso hay tantas películas de superhéroes, tantas series de médicos o seis secuelas de ‘C.S.I.’”, dice Lynn.

Pero en Netflix saben que, además de para films comerciales, “hay demanda de películas independientes y pequeñas. También las incluyen en su catálogo porque quieren estar en ese mercado”, asegura el presidente de Piedmont Media Research.

Netflix asegura que también apuesta por proyectos independientes para que su catálogo no sólo esté dominado por proyectos más comerciales

Con un alcance cada vez más internacional, la variedad aumenta. Los datos sobre sus usuarios les permiten saber qué tipo de contenidos interesan a los españoles, los australianos, los franceses o los brasileños.

Mientras unos temen que la industria se rinda ante una dictadura del 'big data', desde la plataforma se defienden. Si tienen técnicas para asegurar sus inversiones y dar a su público lo que quiere, ¿por qué no utilizarlas? “Evidentemente, no vamos a comprar títulos que nuestra audiencia no quiera ver”, sentencian.