{"id":10036,"date":"2026-03-31T16:30:38","date_gmt":"2026-03-31T20:30:38","guid":{"rendered":"https:\/\/ermdigital.com\/index.php\/2026\/03\/31\/hay-gente-ganando-hasta-600-dolares-a-la-semana-hablando-con-desconocidos-el-objetivo-ensenar-a-la-ia-a-sonar-humana\/"},"modified":"2026-03-31T16:30:38","modified_gmt":"2026-03-31T20:30:38","slug":"hay-gente-ganando-hasta-600-dolares-a-la-semana-hablando-con-desconocidos-el-objetivo-ensenar-a-la-ia-a-sonar-humana","status":"publish","type":"post","link":"https:\/\/ermdigital.com\/index.php\/2026\/03\/31\/hay-gente-ganando-hasta-600-dolares-a-la-semana-hablando-con-desconocidos-el-objetivo-ensenar-a-la-ia-a-sonar-humana\/","title":{"rendered":"Hay gente ganando hasta 600 d\u00f3lares a la semana hablando con desconocidos. El objetivo: ense\u00f1ar a la IA a sonar humana"},"content":{"rendered":"<p>\n      <img decoding=\"async\" src=\"https:\/\/i.blogs.es\/c64647\/chatbot-de-voz-portada\/1024_2000.jpeg\" alt=\"Hay gente ganando hasta 600 d\u00f3lares a la semana hablando con desconocidos. El objetivo: ense\u00f1ar a la IA a sonar humana\">\n    <\/p>\n<p>En los \u00faltimos meses, muchos hemos hablado con una inteligencia artificial sin pensarlo demasiado. Le hemos preguntado dudas, le hemos pedido consejo o simplemente hemos probado hasta d\u00f3nde llega su capacidad para <strong>mantener una conversaci\u00f3n natura<\/strong><strong>l<\/strong>. Herramientas como los modos de voz de <a class=\"text-outboundlink\" href=\"https:\/\/www.xataka.com\/basics\/chatgpt-que-como-usarlo-que-puedes-hacer-este-chat-inteligencia-artificial\" data-vars-post-title=\"ChatGPT: qu\u00e9 es, c\u00f3mo usarlo y qu\u00e9 puedes hacer con este chat de inteligencia artificial\" data-vars-post-url=\"https:\/\/www.xataka.com\/basics\/chatgpt-que-como-usarlo-que-puedes-hacer-este-chat-inteligencia-artificial\">ChatGPT<\/a> o <a class=\"text-outboundlink\" href=\"https:\/\/www.xataka.com\/basics\/google-gemini-que-como-funciona-diferencias-gpt-cuando-podras-usar-este-modelo-inteligencia-artificial\" data-vars-post-title=\"Google Gemini: qu\u00e9 es, c\u00f3mo funciona, diferencias con GPT y cu\u00e1ndo podr\u00e1s usar este modelo de inteligencia artificial\" data-vars-post-url=\"https:\/\/www.xataka.com\/basics\/google-gemini-que-como-funciona-diferencias-gpt-cuando-podras-usar-este-modelo-inteligencia-artificial\">Gemini<\/a> han acercado esa experiencia a algo que, hace no tanto, parec\u00eda reservado a la ciencia ficci\u00f3n, <a class=\"text-outboundlink\" href=\"https:\/\/www.xataka.com\/robotica-e-ia\/openai-acaba-acercarnos-que-nunca-a-her-su-nuevo-modelo-voz-nos-acompanara-quizas-enamorara\" data-vars-post-title=\"OpenAI acaba de acercarnos m\u00e1s que nunca a 'Her': su nuevo modelo de voz nos acompa\u00f1ar\u00e1 (y quiz\u00e1s enamorar\u00e1)\" data-vars-post-url=\"https:\/\/www.xataka.com\/robotica-e-ia\/openai-acaba-acercarnos-que-nunca-a-her-su-nuevo-modelo-voz-nos-acompanara-quizas-enamorara\">con ecos inevitables de \u2018Her\u2019<\/a>. Pero hay una pregunta que rara vez nos hacemos mientras hablamos con ellas: c\u00f3mo han aprendido estas m\u00e1quinas a sonar cada vez menos como un sistema y m\u00e1s como una persona.<\/p>\n<p><!-- BREAK 1 --><\/p>\n<p>Para entenderlo, conviene separar lo que vemos de lo que no vemos. Por un lado est\u00e1n las aplicaciones que usamos a diario, esos asistentes que responden con una voz cada vez m\u00e1s natural. Por otro, los sistemas que las sostienen, <a class=\"text-outboundlink\" href=\"https:\/\/www.xataka.com\/robotica-e-ia\/cada-nuevo-modelo-ia-mejor-historia-que-llega-siguiente-anthropic-openai-han-convertido-eso-negocio\" data-vars-post-title='Hay un nueva generaci\u00f3n de modelos IA a las puertas y Anthropic tiene que venderlos: \"El m\u00e1s grande e inteligente\"' data-vars-post-url=\"https:\/\/www.xataka.com\/robotica-e-ia\/cada-nuevo-modelo-ia-mejor-historia-que-llega-siguiente-anthropic-openai-han-convertido-eso-negocio\">modelos entrenados con grandes vol\u00famenes de datos<\/a> que necesitan aprender no solo qu\u00e9 decir, sino tambi\u00e9n c\u00f3mo decirlo. No sabemos qu\u00e9 productos concretos terminan utilizando este tipo de grabaciones, pero s\u00ed que forman parte del ecosistema con el que se entrenan sistemas de voz cada vez m\u00e1s fluidos y veros\u00edmiles.<\/p>\n<p><!-- BREAK 2 --><\/p>\n<h2><strong>La mano humana detr\u00e1s de una voz artificial<\/strong><\/h2>\n<p>Cuando bajamos al detalle, lo que hacen estos trabajadores no se parece demasiado a la idea cl\u00e1sica de \u201centrenar una IA\u201d. En muchos casos, se trata de mantener conversaciones con desconocidos sobre temas aparentemente triviales, desde gustos cotidianos hasta preguntas abiertas que obligan a desarrollar una respuesta. En otros, el encargo es m\u00e1s exigente: interpretar un papel, seguir un guion sin que lo parezca o <strong>entrar en terrenos emocionales<\/strong>. <a rel=\"noopener, noreferrer\" href=\"https:\/\/www.bloomberg.com\/news\/articles\/2026-03-30\/inside-the-odd-and-oddly-human-work-of-teaching-ai-to-talk\">Bloomberg cuenta<\/a>, por ejemplo, el caso de una trabajadora que relat\u00f3 recuerdos dolorosos de su vida mientras hablaba con un hombre que se presentaba como pastor y que, dentro del ejercicio, interpretaba el papel de terapeuta.<\/p>\n<div class=\"article-asset-video article-asset-normal\">\n<div class=\"asset-content\">\n<div class=\"base-asset-video\">\n<div class=\"js-dailymotion\"><\/div>\n<\/p><\/div>\n<\/p><\/div>\n<\/div>\n<p>Todo ese material grabado sirve para algo muy concreto: capturar matices. No hablamos solo de palabras, sino de pausas, respiraciones, cambios de tono, vacilaciones o reacciones emocionales que hacen que una conversaci\u00f3n suene humana. Tambi\u00e9n hay tareas de etiquetado, en las que los trabajadores tienen que distinguir si un audio contiene un sollozo, una carcajada o a alguien hablando entre risas. La l\u00f3gica de fondo es sencilla: si una m\u00e1quina quiere dejar de sonar rob\u00f3tica, antes necesita exponerse a c\u00f3mo hablamos de verdad.<\/p>\n<p><!-- BREAK 3 --><\/p>\n<div class=\"article-asset-summary article-asset-normal article-asset-center\">\n<div class=\"asset-content\">\n<div class=\"sumario\">Tras superar una prueba inicial de voz, pueden optar a tareas que arrancan en unos 17 d\u00f3lares por hora grabada.<\/div>\n<\/p><\/div>\n<\/div>\n<p>A partir de ah\u00ed, la pregunta es inevitable: c\u00f3mo se accede a este tipo de trabajo y cu\u00e1nto se gana realmente. Plataformas como <a rel=\"noopener, noreferrer\" href=\"https:\/\/www.babel.audio\/\">Babel Audio<\/a> funcionan como intermediarias que conectan a estos trabajadores con proyectos concretos. Tras superar una prueba inicial de voz, pueden optar a tareas que arrancan en unos 17 d\u00f3lares por hora grabada, aunque el ingreso final depende de la evaluaci\u00f3n recibida y del volumen de encargos disponible. Los ingresos, adem\u00e1s, var\u00edan mucho: una trabajadora citada por el mencionado medio asegura ingresar unos <strong>600 d\u00f3lares semanales<\/strong>.<\/p>\n<p><!-- BREAK 4 --><\/p>\n<div class=\"article-asset-image article-asset-normal article-asset-center\">\n<div class=\"asset-content\">\n<div class=\"caption-img \">\n<p>   <img decoding=\"async\" alt=\"Babel Audio Ia 2\" class=\"centro_sinmarco\" src=\"https:\/\/i.blogs.es\/4f8243\/babel-audio-ia-2\/450_1000.png\"><\/p>\n<p>        <span>As\u00ed se ve la p\u00e1gina web de BabelAudio<\/span>\n   <\/div>\n<\/p><\/div>\n<\/div>\n<p>A medida que avanzamos, el trabajo empieza a mostrar una cara menos visible. M\u00e1s all\u00e1 de las tarifas y de la promesa de flexibilidad, los testimonios apuntan a un entorno marcado por la incertidumbre y el control constante. Las plataformas pueden limitar el acceso a tareas, interrumpir proyectos o suspender cuentas sin explicaciones detalladas, lo que deja a muchos trabajadores en una posici\u00f3n fr\u00e1gil. Adem\u00e1s, cada conversaci\u00f3n est\u00e1 sometida a m\u00e9tricas en tiempo real que valoran si alguien habla demasiado o demasiado poco, la expresividad, el dominio del idioma, la profundidad del intercambio y hasta la duraci\u00f3n de las pausas.<\/p>\n<p><!-- BREAK 5 --><\/p>\n<p>Cuando ampliamos el foco, el debate deja de ser \u00fanicamente laboral y pasa a ser tambi\u00e9n personal. Parte del valor de estas grabaciones reside precisamente en que capturan c\u00f3mo hablamos y c\u00f3mo nos relacionamos, lo que implica que los trabajadores est\u00e1n <strong>aportando algo m\u00e1s que una tarea mec\u00e1nica<\/strong>. Las condiciones generalmente permiten usar esas grabaciones en asistentes de voz, s\u00edntesis de habla y \u201cotros productos y servicios relacionados con el audio\u201d.<\/p>\n<p><!-- BREAK 6 --><\/p>\n<div class=\"article-asset article-asset-normal article-asset-center\">\n<div class=\"desvio-container\">\n<div class=\"desvio\">\n<div class=\"desvio-figure js-desvio-figure\">\n    <a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/hay-carrera-ia-mucho-profunda-e-importante-que-china-esta-aplastando-a-sus-competidores-talento-humano\" class=\"pivot-outboundlink\" data-vars-post-title=\"La carrera por la IA no va solo de chips o centros de datos: va de captar talento humano y ah\u00ed China est\u00e1 arrasando\"><br \/>\n     <img loading=\"lazy\" decoding=\"async\" alt=\"La carrera por la IA no va solo de chips o centros de datos: va de captar talento humano y ah\u00ed China est\u00e1 arrasando\" width=\"375\" height=\"142\" src=\"https:\/\/i.blogs.es\/326755\/chino-ia\/375_142.jpeg\"><br \/>\n    <\/a>\n   <\/div>\n<div class=\"desvio-summary\">\n<div class=\"desvio-taxonomy js-desvio-taxonomy\">\n     <a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/hay-carrera-ia-mucho-profunda-e-importante-que-china-esta-aplastando-a-sus-competidores-talento-humano\" class=\"desvio-taxonomy-anchor pivot-outboundlink\" data-vars-post-title=\"La carrera por la IA no va solo de chips o centros de datos: va de captar talento humano y ah\u00ed China est\u00e1 arrasando\">En Xataka<\/a>\n    <\/div>\n<p>    <a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/hay-carrera-ia-mucho-profunda-e-importante-que-china-esta-aplastando-a-sus-competidores-talento-humano\" class=\"desvio-title js-desvio-title pivot-outboundlink\" data-vars-post-title=\"La carrera por la IA no va solo de chips o centros de datos: va de captar talento humano y ah\u00ed China est\u00e1 arrasando\">La carrera por la IA no va solo de chips o centros de datos: va de captar talento humano y ah\u00ed China est\u00e1 arrasando<\/a>\n   <\/div>\n<\/p><\/div>\n<\/p><\/div>\n<\/div>\n<p>Cuando conectamos todas las piezas, lo que vemos es una industria que funciona gracias a una cadena de producci\u00f3n compleja. <a rel=\"noopener, noreferrer\" href=\"https:\/\/pulitzercenter.org\/resource\/how-we-investigated-human-labor-behind-ai\">El Pulitzer Center describe<\/a> este ecosistema como una red de trabajo fragmentado en la que los trabajadores suelen estar sometidos a acuerdos de confidencialidad, operan con muy poca transparencia y, en muchos casos, ni siquiera saben qu\u00e9 sistema est\u00e1n entrenando ni para qu\u00e9 empresa acaba yendo su trabajo. En ese contexto, las conversaciones que alimentan a los sistemas de voz son solo una parte de un engranaje mayor, donde cada tarea contribuye a construir tecnolog\u00edas cada vez m\u00e1s sofisticadas.<\/p>\n<p><!-- BREAK 7 --><\/p>\n<p>Im\u00e1genes | Xataka con Nano Banana 2 | Captura de pantalla<\/p>\n<p>En Xataka | <a class=\"text-outboundlink\" href=\"https:\/\/www.xataka.com\/robotica-e-ia\/felicidades-programas-saber-programar-ahora-preparate-para-esperar-seis-semanas-a-que-apple-te-haga-caso\" data-vars-post-title=\"Felicidades, ya programas sin saber programar. Ahora prep\u00e1rate para esperar seis semanas a que Apple te haga caso\" data-vars-post-url=\"https:\/\/www.xataka.com\/robotica-e-ia\/felicidades-programas-saber-programar-ahora-preparate-para-esperar-seis-semanas-a-que-apple-te-haga-caso\">Felicidades, ya programas sin saber programar. Ahora prep\u00e1rate para esperar seis semanas a que Apple te haga caso<\/a><\/p>\n<p> &#8211; <br \/> La noticia<br \/>\n      <a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/hay-gente-ganando-600-dolares-a-semana-hablando-desconocidos-objetivo-ensenar-a-ia-a-sonar-humana?utm_source=feedburner&amp;utm_medium=feed&amp;utm_campaign=31_Mar_2026\"><br \/>\n       <em> Hay gente ganando hasta 600 d\u00f3lares a la semana hablando con desconocidos. El objetivo: ense\u00f1ar a la IA a sonar humana <\/em><br \/>\n      <\/a><br \/>\n      fue publicada originalmente en<br \/>\n      <a href=\"https:\/\/www.xataka.com\/?utm_source=feedburner&amp;utm_medium=feed&amp;utm_campaign=31_Mar_2026\"><br \/>\n       <strong> Xataka <\/strong><br \/>\n      <\/a><br \/>\n             por <a href=\"https:\/\/www.xataka.com\/autor\/javier-marquez?utm_source=feedburner&amp;utm_medium=feed&amp;utm_campaign=31_Mar_2026\"><br \/>\n        Javier Marquez<br \/>\n       <\/a><br \/>\n      . <\/p>\n<p>\u00a0En los \u00faltimos meses, muchos hemos hablado con una inteligencia artificial sin pensarlo demasiado. Le hemos preguntado dudas, le hemos pedido consejo o simplemente hemos probado hasta d\u00f3nde llega su capacidad para mantener una conversaci\u00f3n natural. Herramientas como los modos de voz de ChatGPT o Gemini han acercado esa experiencia a algo que, hace no tanto, parec\u00eda reservado a la ciencia ficci\u00f3n, con ecos inevitables de \u2018Her\u2019. Pero hay una pregunta que rara vez nos hacemos mientras hablamos con ellas: c\u00f3mo han aprendido estas m\u00e1quinas a sonar cada vez menos como un sistema y m\u00e1s como una persona.<\/p>\n<p>Para entenderlo, conviene separar lo que vemos de lo que no vemos. Por un lado est\u00e1n las aplicaciones que usamos a diario, esos asistentes que responden con una voz cada vez m\u00e1s natural. Por otro, los sistemas que las sostienen, modelos entrenados con grandes vol\u00famenes de datos que necesitan aprender no solo qu\u00e9 decir, sino tambi\u00e9n c\u00f3mo decirlo. No sabemos qu\u00e9 productos concretos terminan utilizando este tipo de grabaciones, pero s\u00ed que forman parte del ecosistema con el que se entrenan sistemas de voz cada vez m\u00e1s fluidos y veros\u00edmiles.<\/p>\n<p>La mano humana detr\u00e1s de una voz artificialCuando bajamos al detalle, lo que hacen estos trabajadores no se parece demasiado a la idea cl\u00e1sica de \u201centrenar una IA\u201d. En muchos casos, se trata de mantener conversaciones con desconocidos sobre temas aparentemente triviales, desde gustos cotidianos hasta preguntas abiertas que obligan a desarrollar una respuesta. En otros, el encargo es m\u00e1s exigente: interpretar un papel, seguir un guion sin que lo parezca o entrar en terrenos emocionales. Bloomberg cuenta, por ejemplo, el caso de una trabajadora que relat\u00f3 recuerdos dolorosos de su vida mientras hablaba con un hombre que se presentaba como pastor y que, dentro del ejercicio, interpretaba el papel de terapeuta.<\/p>\n<p>Todo ese material grabado sirve para algo muy concreto: capturar matices. No hablamos solo de palabras, sino de pausas, respiraciones, cambios de tono, vacilaciones o reacciones emocionales que hacen que una conversaci\u00f3n suene humana. Tambi\u00e9n hay tareas de etiquetado, en las que los trabajadores tienen que distinguir si un audio contiene un sollozo, una carcajada o a alguien hablando entre risas. La l\u00f3gica de fondo es sencilla: si una m\u00e1quina quiere dejar de sonar rob\u00f3tica, antes necesita exponerse a c\u00f3mo hablamos de verdad.<\/p>\n<p>     Tras superar una prueba inicial de voz, pueden optar a tareas que arrancan en unos 17 d\u00f3lares por hora grabada.<\/p>\n<p>A partir de ah\u00ed, la pregunta es inevitable: c\u00f3mo se accede a este tipo de trabajo y cu\u00e1nto se gana realmente. Plataformas como Babel Audio funcionan como intermediarias que conectan a estos trabajadores con proyectos concretos. Tras superar una prueba inicial de voz, pueden optar a tareas que arrancan en unos 17 d\u00f3lares por hora grabada, aunque el ingreso final depende de la evaluaci\u00f3n recibida y del volumen de encargos disponible. Los ingresos, adem\u00e1s, var\u00edan mucho: una trabajadora citada por el mencionado medio asegura ingresar unos 600 d\u00f3lares semanales.<\/p>\n<p>        As\u00ed se ve la p\u00e1gina web de BabelAudio<\/p>\n<p>A medida que avanzamos, el trabajo empieza a mostrar una cara menos visible. M\u00e1s all\u00e1 de las tarifas y de la promesa de flexibilidad, los testimonios apuntan a un entorno marcado por la incertidumbre y el control constante. Las plataformas pueden limitar el acceso a tareas, interrumpir proyectos o suspender cuentas sin explicaciones detalladas, lo que deja a muchos trabajadores en una posici\u00f3n fr\u00e1gil. Adem\u00e1s, cada conversaci\u00f3n est\u00e1 sometida a m\u00e9tricas en tiempo real que valoran si alguien habla demasiado o demasiado poco, la expresividad, el dominio del idioma, la profundidad del intercambio y hasta la duraci\u00f3n de las pausas.<\/p>\n<p>Cuando ampliamos el foco, el debate deja de ser \u00fanicamente laboral y pasa a ser tambi\u00e9n personal. Parte del valor de estas grabaciones reside precisamente en que capturan c\u00f3mo hablamos y c\u00f3mo nos relacionamos, lo que implica que los trabajadores est\u00e1n aportando algo m\u00e1s que una tarea mec\u00e1nica. Las condiciones generalmente permiten usar esas grabaciones en asistentes de voz, s\u00edntesis de habla y \u201cotros productos y servicios relacionados con el audio\u201d.<\/p>\n<p>     En Xataka<\/p>\n<p>    La carrera por la IA no va solo de chips o centros de datos: va de captar talento humano y ah\u00ed China est\u00e1 arrasando<\/p>\n<p>Cuando conectamos todas las piezas, lo que vemos es una industria que funciona gracias a una cadena de producci\u00f3n compleja. El Pulitzer Center describe este ecosistema como una red de trabajo fragmentado en la que los trabajadores suelen estar sometidos a acuerdos de confidencialidad, operan con muy poca transparencia y, en muchos casos, ni siquiera saben qu\u00e9 sistema est\u00e1n entrenando ni para qu\u00e9 empresa acaba yendo su trabajo. En ese contexto, las conversaciones que alimentan a los sistemas de voz son solo una parte de un engranaje mayor, donde cada tarea contribuye a construir tecnolog\u00edas cada vez m\u00e1s sofisticadas.<\/p>\n<p>Im\u00e1genes | Xataka con Nano Banana 2 | Captura de pantalla<\/p>\n<p>En Xataka | Felicidades, ya programas sin saber programar. Ahora prep\u00e1rate para esperar seis semanas a que Apple te haga caso<\/p>\n<p>                 &#8211;  La noticia<\/p>\n<p>        Hay gente ganando hasta 600 d\u00f3lares a la semana hablando con desconocidos. El objetivo: ense\u00f1ar a la IA a sonar humana <\/p>\n<p>      fue publicada originalmente en<\/p>\n<p>        Xataka <\/p>\n<p>             por<br \/>\n        Javier Marquez<\/p>\n<p>      .\u00a0\u00a0\u00a0<\/p>\n","protected":false},"excerpt":{"rendered":"<p>En los \u00faltimos meses, muchos hemos hablado con una inteligencia artificial sin pensarlo demasiado. Le hemos preguntado dudas, le hemos pedido consejo o simplemente hemos probado hasta d\u00f3nde llega su capacidad para mantener una conversaci\u00f3n natural. Herramientas como los modos de voz de ChatGPT o Gemini han acercado esa experiencia a algo que, hace no [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":10037,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"amp_status":"","footnotes":""},"categories":[6],"tags":[],"class_list":["post-10036","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ciencia-y-tecnologia"],"_links":{"self":[{"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/posts\/10036","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/comments?post=10036"}],"version-history":[{"count":0,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/posts\/10036\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/media\/10037"}],"wp:attachment":[{"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/media?parent=10036"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/categories?post=10036"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/tags?post=10036"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}