Noticias falsas, big data y la victoria de Trump




Paul Horner tiene 38 años y asegura que la culpa de que Donald Trump haya ganado las elecciones en Estados Unidos es suya. Horner maneja una decena de páginas web de noticias falsas, hizo creer a casi 5 millones de personas en todo el mundo que el famoso artista callejero Banksy era él, presume de ser un troll de los medios de comunicación, mentiroso profesional, y se ha dedicado durante la última campaña electoral americana a difundir informaciones inventadas que han corrido como la pólvora por las redes sociales (sobre todo vía Facebook). "Creo que Donald Trump está en la Casa Blanca por mi culpa", admitía con pena este jueves en una entrevista con The Washington Post.
Sus "noticias" se cuelan en Google News, arrasan en Facebook y hasta las compartieron sin rubor miembros de la campaña del propio Trump antes de la jornada electoral. El hijo del presidente electo y su jefe de campaña tuitearon las declaraciones de un hombre que aseguraba haber cobrado 3.500 dólares del equipo de Hillary Clinton para protestar durante un mitin del candidato republicano. El hombre, por cierto, se llamaba Paul Horner.
En su web ABC News, diseñada con el aspecto de los medios más rigurosos, publicaba la firma de un decreto por parte de Barack Obama para invalidar el resultado de las elecciones y su historia la compartieron más de 250.000 personas en Facebook. "Sinceramente, la gente es definitivamente estúpida. Nadie comprueba nada y así es como ganó Trump. Él simplemente dijo lo que quería y la gente lo creyó todo. Es muy aterrador", admite Horner en el Post.

Según un estudio de Buzzfeed, en los últimos tres meses de la campaña electoral en EEUU las noticias falsas compartidas en Facebook (muchas más allá de Horner) generaron más impacto que las principales noticias publicadas por The New York Times, The Washington Post o la NBC. Las 20 noticias inventadas sobre las elecciones más virales generaron casi 9 millones de reacciones y comentarios en Facebook por algo más de 7 millones de las informaciones reales. Apunten:

El Papa Francisco pide el voto para Trump...

Hillary Clinton admite en un correo electrónico que es la fundadora de ISIS...

Aparece muerto el agente del FBI sospechoso de haber filtrado los mails de Hillary...

Wikileaks confirma que Hillary Clinton vendió armas al Estado Islámico...

"Facebook y Twitter me han ayudado a ganar", admitía el pasado domingo Donald Trump en una entrevista con la CBS. El nuevo presidente tiene unos 28 millones de seguidores entre Facebook, Twitter e Instagram y promete seguir usando sus perfiles: "Cuando alguien cuenta una mala historia o una historia inexacta tengo un método para defenderme".

  La Big Data compilada por Jonathan Albright.


Jonathan Albright es un periodista, profesor de comunicación en Elon University, e investigador de tendencias digitales, que publica en la plataforma de publicación Medium, creada por el cofundador de Twitter, Evan Williams, para promover la generación de contenidos de más de 140 caracteres.

Albright difundió en Medium un par de investigaciones notables acerca del comportamiento de internet en las elecciones estadounidenses 2016, y sus conclusiones motivaron que otros medios las tuvieran en cuenta. Por ejemplo, la revista Fortune.


Albright diferenció 2 categorías que interactúan entre sí, en el inicio del fenómeno que parece conmover a tantos periodistas y organizaciones de medios hoy día:

> la red de micropropaganda construída por Donald Trump y sus simpatizantes; y

> la red de contenidos o tendenciosos o falsas construidos por los militantes conservadores estadounidenses, y de la que fue beneficiario Trump.

El resultado fue la creación de un ecosistema de alcance notable en internet, y con impacto e interacción con medios convencionales, trascendiendo el alcance de lo que sería el universo republicano.

Cuando semejante maquinaria entró en movimiento generó consecuencias que difícilmente puedan bloquear las redes sociales, o los medios convencionales que tanto se ufanan de que a ellos no les ocurriría lo mismo que a las redes sociales.

Puede suceder algo peor que el ecosistema impacte sobre los medios convencionales: que pueda prescindir parcialmente de ellos.

Aquí un breve compilado de las investigaciones de Albright:

1ra. etapa (publicada el 18/11)

Después de encontrar evidencia de que gran parte del súper influenciado tráfico de noticias “falsas” durante las elecciones en USA 2016 estaba llegando a través de hiperlinks directos, motores de búsqueda y técnicas para compartir propias de “la vieja escuela” (boletines informativos por correo electrónico, RSS y mensajería instantánea), pensé que podía hacer un pequeño proyecto de “grandes datos” (Big Data).

Escribí este artículo porque sentí que el argumento sobre el supuesto papel de Facebook en influenciar el resultado de la elección, no aborda el problema real, que son las fuentes de las falsas, engañosas y súper influenciadas informaciones.


Seguramente la red de publicaciones de Google y el algoritmo de News Feeds (“historias relacionadas”), amplifican el esparcimiento emocional de la mala información, y los medios sociales suben el volumen al nivel de escándalo político.

Sin embargo, al mismo tiempo, yo pienso que los periodistas, investigadores y genios de los datos deberían ver, primero, los factores que están realmente

> produciendo el contenido, y

> conduciendo el tráfico online.

En lugar de analizar a los “conocidos desconocidos” con métricas incompletas y análisis parciales, hay que mirar directamente a la fuente.

Existe en operaciones una amplia red de dudosos sitios de noticias. La mayoría de ellos son de diseño simple, y muchos parecen haber sido programados con las mismas plantillas web.

Estos sitios han creado un ecosistema de propaganda en tiempo real que incluyen disparadores de bromas pesadas virales que instantáneamente pueden darle forma a la opinión pública a través de una “reacción” en masa acerca de temas políticos serios y eventos de noticias. Esta red es activada para esparcir información falsa, súper influenciada y políticamente cargada.

Es lo que yo llamo #MPM, iniciales en inglés de lo que en español sería “máquina de micro-propaganda”: una red de influencia que puede adaptar los comentarios de la gente, reacciones emocionales y crear episodios"virales" alrededor de lo que deberían ser cuestiones o serias o reflexivas.

ocho.png


Ya informé que sólo el 60% del tráfico que ingresa desde una muestra de los principales sitios de noticias “falsos” y súper influenciados parece salir de Facebook y Twitter.

El 40% del tráfico restante es orgánico: visitas a páginas web, participación en redes P2P (peer-to-peer), textos/mensajería instantánea, suscripciones a boletines online, RSS y motores de búsqueda.

Menos del 0,1% del tráfico de los sitios que observé provenía de publicaciones de (conocidos) desconocidos buscadores pagos.

dos.jpg
Descubriendo la #MPM.

Mi suposición es que esta red #MPM de sitios pequeños, “falsos” y súper influenciados ha estado empujando el tráfico a través de links; y ayudando a inyectar este contenido en plataformas como Facebook y Twitter. Este esfuerzo fue probablemente acelerado cuando concluyeron las elecciones primarias de USA, como también cuando cualquier nuevo tema político (que involucre tags tales como “servidores de mails”, “acoso femenino”, “inmigrantes”, etc.) irrumpiera en escena.

Mis datos mostraban que mail.google.com (Gmail) es una de las mayores fuentes “upstreams” de tráfico que viene hacia Infowars.com, un jugador influyente en el ala derecha de la esfera de noticias. Para este proyecto, hice un análisis de datos de media escala, rastreando e indexando 117 páginas web públicamente asociadas con la propagación de contenido de noticias falsas y la viralización de lo que yo llamo “propaganda súper-influenciada”.

Intenté mirar directamente lo que algunos han llamado “la máquina de propaganda alt-right” (o “derecha alternativa”. Un movimiento político que en apenas 1 año subió desde los sótanos de internet hasta la Casa Blanca. “La 'derecha alternativa' es un término acuñado en 2008 por Richard Bertrand Spencer, que encabeza el 'think-tank' supremacista blanco conocido como National Policy Institute, y lo aplica a un conjunto de ideas de extrema derecha enfocadas en la 'identidad blanca’ y la preservación de la ‘civilización occidental’”, según explicó el Southern Poverty Law Center, una ONG que vigila a los “grupos de odio” en USA).

Establecí patrones en los enlaces compartidos para encontrar a qué lugares estas páginas web de noticias falsas parecían vincularse, así como sus destinos más comunes de links entrantes, y la estructura de cómo se integraban en la elección estadounidense 2016:

1. Los objetivos: Principales medios de comunicación, redes sociales, y Wikipedia. Los círculos más grandes del gráfico en esta red de propagandas de noticias falsas son Google, YouTube, el NYTimes.com, Wikipedia y Amazon.com. El dominio de YouTube era de esperarse porque muchos sitios postean vínculos a videos, canales de creadores y material “educativo” de tipo documental.

cuatro.jpg


2. Los medios de comunicación dominantes están generalmente “rodeados”. Si se observa al gráfico de cerca se puede apreciar que los ID de los sitios de “partido de derecha”, “noticias falsas”, “conspiración”, “anti-ciencia”, “bromas pesadas”, “pseudociencia”, “desinformación” (en rojo) básicamente rodean a la mayoría de los principales medios de comunicación incluyendo al medio “liberal” más grande de la red.




Los sitios en la red de noticias falsas y súper influenciadas tienen un tamaño de “nodo” muy pequeño; esto significa que se vinculan al exterior fuertemente con los medios de comunicación principales, redes sociales y fuentes de información (la mayoría de los cuales están en el centro del gráfico), pero no hay muchos enlaces de vuelta.

Los sitios más influyentes trazan la línea de la periferia de la red de la propaganda virtual. Se puede observar que muchos de estos tienen grandes cantidades de hipervínculos rojos saliendo de ellos, algunos cuentan por miles. Para los propósitos del análisis, las líneas rojas (cada una representando un URL diferente) “importan” más cuando se dirigen hacia grandes nódulos en el centro del cuadro.

3. Uso compartido de contenido y Media Hosting. Hay un alto número de enlaces a creación de contenidos y servicios de recepción de activos web (Wordpress.com, Statcounter.com, WP.com, etc.). Estos son probablemente compartidos para ayudar a los usuarios de las páginas web a producir contenido y medir el impacto de sus audiencias. Las imágenes también sugieren que estos sitios de noticias falsas usan plataformas para compartir como también coordinar a través de hipervínculos.

En otras palabras: Si uno mira las imágenes más grandes del cuadro, uno puede ver el efecto coordinado de los hipervínculos de las páginas individuales. Uno puede ver cuántos grandes nódulos rojos tienen “agrupamientos de interés” más pequeños que parecen consistir principalmente en cuentas en Twitter, paginas públicas de Facebook y otros sitios de web basados en temas diversos.




4. Material y herramientas de producción digital y comercio electrónico. Hay un interesante número de enlaces que apuntan a bienes de consumo, sitios de comercios y herramientas de producción digital. Estas incluyen CafePress (remeras), FreeBurner (noticias RSS), y Addthis.com (intercambios sociales).

Esto puede significar que la red de propaganda puede estar usando estos recursos internamente para esparcir (como también para generar algún tipo de ingreso monetario) de noticias de eventos políticos y debates políticos. Estos enlaces pueden ser llevados a otros lugares de la internet, especialmente plataformas sociales como Facebook y Twitter.

Extrañamente, Amazon.com también es uno de los mayores destinos de enlaces.

siete.jpg


5. Comprobación de hechos y edición de conocimientos. El cuadro se enlaza a los sitios de encuestas tales como Gallup y recursos de referencias de fuentes y verificación, en especial Wikipedia, Reddit y Wikimedia. Snopes y otros sitios de verificación de noticias falsas están en el bando “liberal” del cuadro.

El cuadro claramente se divide en varias regiones ideológicas: las áreas de la izquierda y los actores “alt right” y “hard right”; la región central superior muestra una fuerte base religiosa como también un fuerte componente anti-islam.

El lado de la derecha parece ser el más “liberal”, y añade crecientes números de actores gubernamentales mientras se van uniendo a los actores religiosos conservadores de la derecha ‘dura’ alrededor del centro medio superior de la red. La región inferior a la izquierda agrupa a cuentas influyentes de medios sociales, y el centro inferior implica a muchas agencias de información internacionales.

La gran y cercana presencia de los enlaces de Amazon.com en la red parece ser a través de los enlaces de los sitios de noticas falsas con los afiliados vendedores de Amazon.

No está bueno darse vuelta y culpar a Facebook, Twitter y Google por nuestro esparcimiento social y nuestros problemas culturales. Quiero decir: ¿por qué mirar al resultado cuando podemos ver el problema?

2da. etapa (Albright amplía su investigación; publicada el 28/11)

El análisis se amplió a 1,3 millón de hipervínculos capturados a través del ecosistema de “noticias falsas” y la máquina de micro propaganda de la derecha.

En una nota de opinión de The New York Times, William Davie, profesor asociado en la Universidad de Londres, elabora:

“Estamos en medio de la transición de una sociedad de hechos a una sociedad de datos. Durante este ínterin, la confusión abunda en torno a la situación exacta del conocimiento y sus números en la vida pública, exacerbando el sentido de que la verdad misma está siendo abandonada.

Una vez que los números son vistos como indicadores del sentimiento actual, en lugar de declaraciones de la realidad, ¿cómo vamos a alcanzar un consenso acerca de los problemas sociales, económicos y ambientales, sin importar si acordamos en las soluciones? Las teorías conspirativas prosperan bajo tales condiciones. Y mientras tengamos muchos más medios para saber cuántas personas creen estas teorías, tendremos muchos menos medios para persuadirlas de que las abandonen”.

El pensar sobre las noticias falsas no significa extraer los hashtags, las proporciones de emojis para posteos de Facebook, o usar un multivariado análisis estadístico que estime el número de retweets que recibe todos los días el equipo de transición de Donald Trump.

Todo esto puede ser interesante, pero no es muy relevante para resolver los problemas.

Necesitamos serias reflexiones para pasar a través de las noticias falsas, y esta área involucra un mejor entendimiento de la infraestructura (ejemplo, la internet) que hemos construido y que ayuda a permitir esto.

No ayuda trazar millones de reacciones de Facebook ante una noticia falsa y analizar en un tablero los hashtags de impacto social buscando respuestas. Necesitamos empezar a pensar en las “ideas” que van más allá de la atracción gravitacional de las redes sociales, los algoritmos de filtrado, etc.

20 millones de seguidores, y la mitad de ellos dan un desagrado a cualquier posteo. Es bastante fácil ver como estuvo trabajando el análisis de sentimientos. Donald John Trump podría postear que el “va a ir a Starbucks y comprar un macchiato de caramelo” y conseguir al menos 150.000 emojis con un par de teorías conspirativas. ¿Para qué nos sirve eso?

El siguiente gráfico de redes de “grandes datos” muestra la máquina de propaganda de la derecha estadounidense. Los datos de mi lista expandida de 306 sitios de falsas noticias contienen 1.338.017 conexiones de hipervínculos. También decidí mirar a los 3 “portaaviones” de los medios de la derecha: Breitbart, Infowars y Fox News.

No me importa mucho qué contenidos están compartiendo en sus sitios todos los días estas noticias falsas y máquina de propaganda. Me preocupa cómo estos sitios están conectados y han formado el “Voltron” de las noticias de la derecha (el legendario "Defensor del Universo" Voltron, es un robot guerrero de 100 metros de altura compuesto por 5 leones robot, una serie producida por DreamWorks Animation Television y World Events Productions y animada por Studio Mir cuyo estreno en Netflix fue el 10/06/2016 con 11 episodios.)

Posiblemente es la más poderosa máquina de propaganda en la historia de la política electoral de USA.

Utilicé 2 capas diferentes de redes de propaganda para este análisis.

1ro., un nivel “local”, lo que significa que estamos mirando a los enlaces compartidos exclusivamente entre los grupos de los 306 sitios identificados de micro-propaganda y 21.666 páginas diferentes.

En total, 1.338.017 hipervínculos fueron capturados en Game 7 como datos finales de #noticiasfalsas.

Viendo al grupo principal de actores (los 306), para identificar los sitios que están al frente y al centro en la red de noticias falsas “local” de la derecha, hay 2 sitios fácilmente distinguibles que se vinculan, hacia afuera, a otras locaciones en el mismo código zip. Esto significa que estos sitios son los centros que potencialmente dirigen el tráfico de buscadores de información a través de miles de otros nodos.




Destacan Conservapedia y Rense. El gráfico de Conservapedia sugiere que se ha convertido en un tipo de Wikipedia para la propaganda de derecha. (De hecho, Conservapedia fue creada por militantes de la derecha cristiana estadounidense que considera a Wikipedia atea y de izquierda). Supongo que tiene que haber algún tipo de wiki para que todos estos hechos posteriores se organicen.

En el 2do. grafico, aunque no esté familiarizado con Rense, se encuentra enlazándose hacia afuera con un montón de otros sitios en cuyo grupo central están sitios de propaganda.




Parece ser casi idéntico al análisis que hice para el otro grupo de 117 sitios web: YouTube es el destino de enlaces de propaganda de derecha Nº1. Como antes, será interesante ver exactamente qué videos y canales son los más comunes a través de este grupo de 306 páginas web. Extraer los datos de la API de YouTube (destinos/URL) puede ser la manera más productiva para profundizar el análisis.



once.jpg


Las imágenes debajo son la “internet” de noticias de la derecha. Debo señalar que no todos estos sitios adicionales son de noticias falsas. Pero como los gráficos están basados en los 306 actores que están conectados a ellos a través de hipervínculos, esto significa que los sitios están conectados los unos a los otros.

Esta gran escala de ecosistemas de redes consiste en 767.382 diferentes páginas web. Esto es el ecosistema de medios de propaganda de derecha.

Éste grafico es el más fascinante: Las burbujas rojas (objetivos de enlace) incluyen al The Washington Post, The New York Times, Google, CNN y Fox News abajo a la izquierda. Me encantaría saber por qué Fox News es segmentado del agrupamiento de medios de difusión y periódicos principales enlazados dentro por el extendido ecosistema de noticias de derecha.

doce.jpg



En esta escala más grande, se incluyen sitios del grupo central de 306, como también enlaces que conectan hacia afuera hacia un ecosistema más grande de noticias.

Conservapedia sigue siendo el mayor centro distribuidor de enlaces, pero en este grafico de redes, Nodisinfo.com parece acercarse para desafiar a Rense por la posición Nº2 de enlaces que se dirigen hacia otros lugares.

Es un poco más lejos del "centro" de la red, probablemente tiene una base más específica de visitantes.

Para resumir, la página web de mayor alcance hacia afuera de esta red es Conservapedia, un recurso wiki-informacional, un centro estratégico dentro de la máquina de micro-propaganda localizada, como también para el gran ecosistema de noticias de derecha.




En el lado receptor de conexión de enlace de la red estaba YouTube, el cual tenía 182 enlaces viniendo hacia su sitio desde otros sitios.

Parece que YouTube es más importante (en términos relativos) como contenedor de contenidos, archivo de videos y TV por cable para la red de micro-propaganda que para el gran ecosistema de noticias de derecha.

No estoy poniéndome en ningún bando: El punto de este proyecto era ver que podía decirnos una gran y relevante muestra de “grandes datos” sobre las noticias falsas.

Admito que hay una concentración en un cierto grupo de actores: los grandes medios de noticias de derecha y los más pequeños grupos de páginas web concentradas en la propaganda.

Pero mi intención es que estos datos permitan un mejor debate futuro sobre “noticias falsas”, carece de sentido concentrarse en desmerecerlas.

Reportar que tal noticia es “falsa”, o tiene afirmaciones insostenibles o evidencia incompleta, no es el mejor enfoque; de hecho, es la peor estrategia, porque añade ruido al ya existente.

El problema de fondo consiste en que muchos periodistas y organizaciones de noticias producen noticias en respuesta a su público en lugar de liderar el camino para informarles sobre las cuestiones subyacentes.

Lo que está "en el interés público" parece ser lo contrario a lo que "el público está interesado en".

Los medios de noticias necesitan dejar de vender sus productos basados en la atención de la gente y empezar a encontrar formas de venderles la verdad.