1 00:00:05,888 --> 00:00:09,312 Se hablan aproximadamente 7.500 idiomas 2 00:00:09,312 --> 00:00:10,806 en el planeta hoy en día. 3 00:00:11,770 --> 00:00:13,808 De esos, se estima 4 00:00:13,808 --> 00:00:18,466 que el 70 % corre peligro de no sobrevivir 5 00:00:18,466 --> 00:00:20,355 al fin del siglo XXI. 6 00:00:22,270 --> 00:00:24,266 Cada vez que muere un idioma, 7 00:00:24,711 --> 00:00:26,622 se corta una conexión, 8 00:00:26,622 --> 00:00:30,590 que ha durado desde cientos hasta miles de años, 9 00:00:30,590 --> 00:00:34,816 a la cultura, a la historia 10 00:00:35,320 --> 00:00:38,150 a las tradiciones y al conocimiento. 11 00:00:38,933 --> 00:00:42,250 El lingüista Kenneth Hale dijo 12 00:00:42,250 --> 00:00:44,183 que cada vez que muere un idioma, 13 00:00:44,183 --> 00:00:46,794 es como arrojar una bomba atómica en el Louvre. 14 00:00:49,377 --> 00:00:51,844 Entonces, la pregunta es: 15 00:00:52,730 --> 00:00:54,800 ¿por qué mueren los idiomas? 16 00:00:56,244 --> 00:01:00,155 Bien, quizás la respuesta simple sería 17 00:01:00,162 --> 00:01:03,051 que se podría pensar que los gobiernos autoritarios 18 00:01:03,051 --> 00:01:05,311 impiden que las personas hablen su lengua nativa, 19 00:01:05,844 --> 00:01:09,630 castigan a los niños por hablar su idioma en la escuela 20 00:01:09,866 --> 00:01:12,911 o el gobierno cierra las estaciones de radio 21 00:01:12,923 --> 00:01:14,644 de la lengua minoritaria. 22 00:01:15,044 --> 00:01:16,977 Y esto ha ocurrido en el pasado, 23 00:01:16,977 --> 00:01:19,088 y aún ocurre hoy en día hasta cierto punto. 24 00:01:19,616 --> 00:01:23,026 Pero la respuesta honesta 25 00:01:23,026 --> 00:01:26,666 es que en la mayoría de los casos de la extinción de una lengua, 26 00:01:27,296 --> 00:01:29,336 es una respuesta mucho más simple 27 00:01:29,336 --> 00:01:32,555 y más fácil de explicar. 28 00:01:33,696 --> 00:01:36,218 Los idiomas se extinguen 29 00:01:36,220 --> 00:01:37,888 porque no se transmiten 30 00:01:37,888 --> 00:01:39,733 de una generación a la siguiente. 31 00:01:42,280 --> 00:01:43,866 Cada vez que una persona que habla 32 00:01:43,866 --> 00:01:46,088 un idioma minoritario tiene un hijo, 33 00:01:46,752 --> 00:01:50,355 realiza un cálculo. 34 00:01:51,360 --> 00:01:52,800 Se pregunta: 35 00:01:53,660 --> 00:01:56,288 "¿Le enseño mi idioma a mi hijo 36 00:01:56,770 --> 00:02:01,311 o le enseño solo el idioma mayoritario?". 37 00:02:01,311 --> 00:02:03,222 Básicamente, hay una balanza 38 00:02:03,900 --> 00:02:05,844 a la que accede en su mente, 39 00:02:06,720 --> 00:02:08,355 en la que de un lado 40 00:02:09,530 --> 00:02:11,733 cada vez en su vida 41 00:02:11,737 --> 00:02:14,222 que tuvo la oportunidad de usar su lengua nativa 42 00:02:14,866 --> 00:02:18,490 para comunicarse, para acceder a la cultura tradicional, 43 00:02:19,776 --> 00:02:21,748 se coloca una piedra en el lado izquierdo. 44 00:02:22,228 --> 00:02:23,840 Y cada vez que resulta 45 00:02:23,840 --> 00:02:25,755 que no puede usar su lengua nativa 46 00:02:25,770 --> 00:02:27,955 y debe depender del idioma mayoritario, 47 00:02:27,958 --> 00:02:30,066 se coloca una piedra en el lado derecho. 48 00:02:31,822 --> 00:02:34,800 Debido a la fortaleza y a la dignidad 49 00:02:34,800 --> 00:02:36,600 de poder hablar la lengua materna propia, 50 00:02:36,600 --> 00:02:38,720 las piedras de la izquierda suelen ser más pesadas. 51 00:02:38,720 --> 00:02:42,048 Pero con suficientes piedras en el lado derecho, 52 00:02:42,560 --> 00:02:44,600 entonces al final la balanza se inclina, 53 00:02:44,600 --> 00:02:47,111 y entonces cuando una persona toma la decisión 54 00:02:47,111 --> 00:02:49,150 de transmitir su idioma, 55 00:02:49,160 --> 00:02:50,622 ven a su propia lengua 56 00:02:50,622 --> 00:02:52,620 como una carga en lugar de una bendición. 57 00:02:55,200 --> 00:02:58,676 Entonces, la pregunta es: ¿cómo revertimos esto? 58 00:02:59,450 --> 00:03:01,777 Primero, debemos pensar en el hecho 59 00:03:03,511 --> 00:03:04,968 de que, para cualquier idioma, 60 00:03:04,970 --> 00:03:07,900 existen ciertas esferas sociales en las que se puede usar. 61 00:03:07,900 --> 00:03:08,976 Entonces, cualquier idioma 62 00:03:08,976 --> 00:03:10,800 que es una lengua materna hablada hoy en día 63 00:03:10,800 --> 00:03:12,990 se puede usar con la familia propia. 64 00:03:13,790 --> 00:03:16,671 Un conjunto menor de idiomas se pueden usar con la comunidad, 65 00:03:16,671 --> 00:03:18,660 un conjunto menor, quizás dentro de una región, 66 00:03:19,288 --> 00:03:22,155 y un puñado menor de lenguas, 67 00:03:22,511 --> 00:03:24,488 se pueden usar para la comunicación internacional. 68 00:03:25,824 --> 00:03:28,640 E incluso a través de estas esferas, 69 00:03:28,640 --> 00:03:31,712 existe la pregunta: ¿puede alguien usar su idioma 70 00:03:31,712 --> 00:03:35,533 con el objetivo de la educación, los negocios 71 00:03:35,911 --> 00:03:37,600 o en la tecnología? 72 00:03:39,136 --> 00:03:41,952 Entonces, para explicar mejor 73 00:03:43,200 --> 00:03:44,530 lo que estoy diciendo aquí, 74 00:03:44,530 --> 00:03:46,393 quisiera usar una anécdota. 75 00:03:48,400 --> 00:03:50,400 Digamos que está a punto de irse 76 00:03:50,400 --> 00:03:52,280 a sus vacaciones soñadas en India, 77 00:03:53,155 --> 00:03:56,032 y tiene una escala de ocho horas en Estambul. 78 00:03:57,312 --> 00:04:00,640 No planeaba visitar Turquía necesariamente, 79 00:04:00,896 --> 00:04:04,266 pero con la escala y un amigo turco 80 00:04:04,266 --> 00:04:05,933 que le habla de un restaurante increíble 81 00:04:05,933 --> 00:04:07,400 que no está lejos del aeropuerto, 82 00:04:07,800 --> 00:04:10,600 dice: "Quizás iré durante la escala". 83 00:04:11,022 --> 00:04:12,920 Entonces, sale del aeropuerto, 84 00:04:13,950 --> 00:04:15,480 llega al restaurante, 85 00:04:15,480 --> 00:04:17,020 le dan un menú 86 00:04:17,020 --> 00:04:19,086 y este menú está completamente en turco. 87 00:04:20,170 --> 00:04:22,911 Ahora, supongamos, por la idea de este ejercicio, 88 00:04:22,911 --> 00:04:24,377 que no habla turco. 89 00:04:25,210 --> 00:04:26,535 ¿Qué hace? 90 00:04:28,155 --> 00:04:29,744 Bien, en el mejor de los casos, 91 00:04:29,744 --> 00:04:32,177 encuentra a alguien que hable su idioma nativo, 92 00:04:32,383 --> 00:04:34,264 alemán, inglés, etc. 93 00:04:36,220 --> 00:04:37,997 Pero, supongamos que no es su día de suerte 94 00:04:38,000 --> 00:04:41,066 y nadie en el restaurante habla alemán ni inglés. 95 00:04:42,000 --> 00:04:43,377 ¿Qué hace? 96 00:04:43,377 --> 00:04:45,995 Si es como yo, e imagino que la mayoría lo es, 97 00:04:45,995 --> 00:04:48,130 probablemente irá a una solución tecnológica, 98 00:04:49,535 --> 00:04:52,351 la traducción automática o un diccionario digital, 99 00:04:52,607 --> 00:04:54,196 busca cada palabra individualmente 100 00:04:54,399 --> 00:04:57,733 y al final pide una comida turca deliciosa. 101 00:04:59,970 --> 00:05:02,844 Ahora, imaginemos este escenario 102 00:05:03,610 --> 00:05:06,400 en donde es hablante nativo de una lengua minoritaria. 103 00:05:07,455 --> 00:05:09,333 Por ejemplo, el bajo sorabo. 104 00:05:09,333 --> 00:05:11,000 El bajo sorabo es una lengua en extinción 105 00:05:11,000 --> 00:05:12,488 que se habla aquí en Alemania, 106 00:05:12,488 --> 00:05:16,888 a unos 130 kilómetros al sureste de aquí, 107 00:05:17,711 --> 00:05:20,857 y solo la hablan pocos miles de personas, mayormente ancianos. 108 00:05:22,810 --> 00:05:25,111 Supongamos que su lengua nativa es el bajo sorabo. 109 00:05:25,370 --> 00:05:26,773 Llega al restaurante. 110 00:05:26,773 --> 00:05:28,462 La probabilidad de encontrar a alguien 111 00:05:28,462 --> 00:05:31,387 que hable su lengua nativa en el restaurante es muy baja. 112 00:05:32,280 --> 00:05:36,412 Pero, de nuevo, puede usar una solución tecnológica. 113 00:05:36,890 --> 00:05:39,333 Sin embargo, para su idioma nativo, 114 00:05:39,333 --> 00:05:41,718 estas soluciones tecnológicas no existen. 115 00:05:42,010 --> 00:05:44,991 Debería depender del alemán o el inglés 116 00:05:44,991 --> 00:05:47,488 como lenguaje de pivote hacia el turco. 117 00:05:48,920 --> 00:05:52,382 También podría terminar consiguiendo su comida turca deliciosa, 118 00:05:52,382 --> 00:05:54,860 pero comienza a pensar lo difícil que hubiera sido 119 00:05:54,860 --> 00:05:57,170 si fuera su abuelo, que no hablaba alemán para nada. 120 00:05:58,244 --> 00:05:59,840 Este es solo un pequeño incidente, 121 00:05:59,844 --> 00:06:04,787 pero colocará una piedra en el lado derecho de la balanza, 122 00:06:05,310 --> 00:06:07,053 y quizás le haga pensar 123 00:06:07,053 --> 00:06:09,898 que cuando tenga hijos o cuando tenga otro hijo, 124 00:06:10,943 --> 00:06:14,726 la carga que soportó 125 00:06:14,726 --> 00:06:17,133 podría no valer la pena para conservar su idioma. 126 00:06:19,391 --> 00:06:21,284 E imagine si este fuera un escenario 127 00:06:21,284 --> 00:06:26,177 con importancia más significativa, 128 00:06:26,177 --> 00:06:28,380 como, por ejemplo, estar en un hospital. 129 00:06:31,133 --> 00:06:36,161 Este es el punto en donde podemos ayudar, 130 00:06:36,790 --> 00:06:40,242 me refiero a que ustedes en esta sala y yo podemos ayudar. 131 00:06:41,400 --> 00:06:43,355 Tenemos las herramientas para ayudar. 132 00:06:45,155 --> 00:06:47,135 Si las herramientas tecnológicas están disponibles 133 00:06:47,143 --> 00:06:49,350 para quienes hablan idiomas minoritarios y marginados, 134 00:06:50,555 --> 00:06:54,022 coloca un dedo en el lado izquierdo de la balanza. 135 00:06:54,022 --> 00:06:55,776 Alguien no debe pensar necesariamente 136 00:06:55,776 --> 00:06:57,680 que deben depender de un idioma minoritario 137 00:06:57,680 --> 00:06:59,488 para interactuar con el mundo exterior, 138 00:07:00,351 --> 00:07:05,111 porque abre las esferas sociales 139 00:07:05,111 --> 00:07:06,328 un poco más. 140 00:07:07,910 --> 00:07:10,333 Por supuesto, la solución ideal 141 00:07:10,333 --> 00:07:13,022 es tener traducción automática en todos los idiomas del mundo. 142 00:07:13,022 --> 00:07:16,831 Pero, lamentablemente, no es factible. 143 00:07:16,831 --> 00:07:19,800 La traducción automática requiere un gran corpus de texto, 144 00:07:19,800 --> 00:07:21,088 y para muchos de estos idiomas 145 00:07:21,088 --> 00:07:23,080 que están en extinción o marginados, 146 00:07:23,391 --> 00:07:25,439 estos datos no están disponibles. 147 00:07:26,309 --> 00:07:28,279 Algunos ni siquiera se escriben comúnmente, 148 00:07:29,000 --> 00:07:32,825 entonces, conseguir suficientes datos y crear un motor de traducción automática 149 00:07:32,825 --> 00:07:34,390 es poco probable. 150 00:07:34,390 --> 00:07:38,060 Pero lo que sí está disponible son los datos léxicos. 151 00:07:40,244 --> 00:07:43,444 Mediante el trabajo de muchos lingüistas 152 00:07:43,444 --> 00:07:45,440 a lo largo de los últimos cien años, 153 00:07:47,777 --> 00:07:49,728 se han producido diccionarios y manuales 154 00:07:49,728 --> 00:07:51,680 para la mayoría de los idiomas del mundo. 155 00:07:53,920 --> 00:07:56,511 Pero, lamentablemente, la mayoría de estas obras 156 00:07:56,511 --> 00:08:00,644 no son accesibles o no están disponibles para el mundo, 157 00:08:00,647 --> 00:08:03,533 y menos para hablantes de los idiomas minoritarios. 158 00:08:04,522 --> 00:08:06,377 Y no es un proceso intencional, 159 00:08:06,377 --> 00:08:07,910 muchas veces es solo porque 160 00:08:07,910 --> 00:08:10,785 la primera edición de estos diccionarios era pequeña, 161 00:08:11,155 --> 00:08:12,543 y las únicas copias 162 00:08:12,543 --> 00:08:16,244 se están pudriendo en la biblioteca de alguna universidad. 163 00:08:17,511 --> 00:08:21,333 Pero tenemos la capacidad de tomar esa información 164 00:08:21,333 --> 00:08:23,330 y hacerla accesible para el mundo. 165 00:08:24,133 --> 00:08:28,377 La Fundación Wikimedia es una de las mejores organizaciones, 166 00:08:28,377 --> 00:08:30,555 yo diría que es la mejor organización de todo el mundo, 167 00:08:30,975 --> 00:08:33,396 para proporcionar datos 168 00:08:33,396 --> 00:08:36,688 a la mayoría de la población del planeta. 169 00:08:38,533 --> 00:08:40,134 Entonces, trabajemos en eso. 170 00:08:41,000 --> 00:08:43,222 Para explicar un poco más 171 00:08:43,224 --> 00:08:45,050 lo que hemos estado haciendo al respecto, 172 00:08:45,311 --> 00:08:48,127 quisiera presentar a mi organización, PanLex, 173 00:08:48,711 --> 00:08:51,888 que es una organización que intenta 174 00:08:51,888 --> 00:08:54,146 recolectar datos léxicos para este propósito. 175 00:08:54,780 --> 00:08:56,830 Empezamos hace 12 años 176 00:08:56,830 --> 00:08:59,600 en la Universidad de Washington, como un proyecto de investigación. 177 00:08:59,600 --> 00:09:01,088 La idea detrás 178 00:09:01,088 --> 00:09:03,990 era mostrar que las traducciones inferidas 179 00:09:04,377 --> 00:09:07,125 podían crear un dispositivo de traducción efectivo, 180 00:09:07,125 --> 00:09:09,088 básicamente, un dispositivo de traducción léxico. 181 00:09:09,088 --> 00:09:12,223 Este es un ejemplo de los datos de PanLex. 182 00:09:12,680 --> 00:09:14,057 Muestra cómo traducir 183 00:09:14,066 --> 00:09:17,805 la palabra turca "ev", que significa casa, 184 00:09:17,805 --> 00:09:19,555 a bajo sorabo, 185 00:09:19,555 --> 00:09:21,201 el idioma que mencioné antes. 186 00:09:21,212 --> 00:09:23,190 Es poco probable encontrar 187 00:09:24,333 --> 00:09:26,200 diccionarios de turco-bajo sorabo, 188 00:09:26,200 --> 00:09:28,244 pero al pasarla por medio 189 00:09:28,244 --> 00:09:30,240 de muchos idiomas intermedios diferentes, 190 00:09:30,488 --> 00:09:32,600 se puede crear traducciones efectivas. 191 00:09:34,333 --> 00:09:36,911 Una vez que se demostró esto en los proyectos de investigación, 192 00:09:36,911 --> 00:09:39,631 el fundador de PanLex, el Dr. Jonathan Pool, 193 00:09:40,711 --> 00:09:43,666 decidió: "¿Por qué no hacemos esto?". 194 00:09:43,666 --> 00:09:45,470 Entonces, comenzó una ONG 195 00:09:45,470 --> 00:09:48,522 para recolectar todos los datos léxicos posibles y hacerlos accesibles. 196 00:09:48,911 --> 00:09:51,066 Eso es lo que hemos hecho en los últimos 12 años. 197 00:09:51,066 --> 00:09:54,516 En ese tiempo, recolectamos miles y miles de diccionarios, 198 00:09:54,516 --> 00:09:56,479 extrajimos la información léxica 199 00:09:56,479 --> 00:10:01,340 y compilamos una base de datos que permite la traducción léxica inferida 200 00:10:01,340 --> 00:10:03,755 entre cualquiera de... 201 00:10:03,755 --> 00:10:05,866 Nuestro conteo actual es alrededor de 5.500 202 00:10:05,868 --> 00:10:07,963 de los 7.500 idiomas del mundo. 203 00:10:08,511 --> 00:10:10,685 Y, desde luego, 204 00:10:10,685 --> 00:10:12,221 intentamos constantemente expandir eso 205 00:10:12,221 --> 00:10:14,784 y aumentar los datos sobre cada idioma individual. 206 00:10:17,220 --> 00:10:21,111 Entonces, la siguiente pregunta es: 207 00:10:22,079 --> 00:10:25,663 ¿qué podemos hacer para trabajar juntos en esto? 208 00:10:26,680 --> 00:10:28,931 En PanLex, hemos observado con mucha emoción 209 00:10:28,931 --> 00:10:31,260 el desarrollo sobre la información léxica, 210 00:10:31,260 --> 00:10:34,175 en lo que Wikidata ha trabajado últimamente. 211 00:10:35,155 --> 00:10:37,548 Es fascinante ver que las organizaciones 212 00:10:37,550 --> 00:10:39,476 están trabajando en una esfera muy similar, 213 00:10:39,476 --> 00:10:41,183 pero en aspectos diferentes. 214 00:10:41,535 --> 00:10:44,351 Y estamos muy emocionados por ver 215 00:10:44,733 --> 00:10:46,466 los resultados de Wikidata. 216 00:10:46,466 --> 00:10:51,144 Además, tenemos ganas de colaborar con Wikidata. 217 00:10:53,844 --> 00:10:56,271 Creo que las capacidades especiales 218 00:10:56,271 --> 00:10:58,022 que desarrollamos en los últimos 12 años, 219 00:10:58,022 --> 00:11:01,555 no solo al recolectar datos léxicos, sino en el diseño de bases de datos, 220 00:11:01,557 --> 00:11:03,908 podrían ser extremadamente útiles para Wikidata. 221 00:11:03,910 --> 00:11:07,111 Por otra parte, creo que... 222 00:11:08,415 --> 00:11:10,975 En especial, me emociona la capacidad 223 00:11:11,743 --> 00:11:14,549 de Wikidata para crear datos de colaboración abierta. 224 00:11:15,129 --> 00:11:18,047 Actualmente, los recursos de PanLex son 225 00:11:18,399 --> 00:11:20,959 recursos léxicos impresos u otra clase de recursos léxicos, 226 00:11:21,170 --> 00:11:22,662 pero no hay una colaboración abierta. 227 00:11:22,670 --> 00:11:24,920 Simplemente, no tenemos la infraestructura 228 00:11:24,920 --> 00:11:26,931 y, por supuesto, la Fundación Wikimedia 229 00:11:26,933 --> 00:11:28,930 es la experta mundial de la colaboración abierta. 230 00:11:31,848 --> 00:11:33,728 Espero con ansias ver exactamente 231 00:11:33,733 --> 00:11:35,680 cómo podemos unir estas habilidades. 232 00:11:38,533 --> 00:11:41,600 Pero, en general, creo que lo principal que debemos considerar 233 00:11:41,600 --> 00:11:43,457 cuando trabajábamos en estas cosas 234 00:11:43,461 --> 00:11:45,133 es el detalle. 235 00:11:45,133 --> 00:11:47,533 Estamos de brazos cruzados, mirando formas gramaticales 236 00:11:47,533 --> 00:11:51,911 o pasando hojas de diccionarios antiguos 237 00:11:51,915 --> 00:11:53,977 o, a veces, de diccionarios publicados recientemente 238 00:11:53,977 --> 00:11:57,466 y transformándolos en palabras de forma escrita, 239 00:11:57,466 --> 00:11:59,994 y se siente muy íntimo. 240 00:11:59,994 --> 00:12:01,535 Pero, ocasionalmente, debemos recordar 241 00:12:01,535 --> 00:12:02,556 retroceder un paso 242 00:12:02,556 --> 00:12:04,951 con respecto a que, aunque lo que hacemos 243 00:12:06,231 --> 00:12:08,831 se sienta mundano a veces, 244 00:12:10,091 --> 00:12:11,957 el trabajo que hacemos es muy importante. 245 00:12:13,010 --> 00:12:15,666 En mi opinión, esta es la mejor manera 246 00:12:15,666 --> 00:12:18,862 de apoyar a los idiomas en extinción 247 00:12:18,862 --> 00:12:21,488 y asegurarnos de que la diversidad lingüística del planeta 248 00:12:21,488 --> 00:12:25,730 se preserve hasta el final de este siglo o más. 249 00:12:26,444 --> 00:12:29,644 Es completamente posible que el trabajo que hacemos hoy 250 00:12:29,644 --> 00:12:32,577 resulte en que los idiomas 251 00:12:32,577 --> 00:12:35,355 se preserven y se transmitan 252 00:12:35,355 --> 00:12:36,955 y que no se extingan. 253 00:12:38,527 --> 00:12:40,605 Entonces, recuerden 254 00:12:40,605 --> 00:12:43,207 que incluso si se está sentado en la computadora 255 00:12:43,207 --> 00:12:44,480 editando una entrada individual 256 00:12:44,480 --> 00:12:49,707 y agregando los datos de un idioma minoritario 257 00:12:49,707 --> 00:12:51,796 para cada sustantivo, 258 00:12:51,800 --> 00:12:54,577 esa pequeña cosa que hace ahora mismo, 259 00:12:54,577 --> 00:12:57,528 podría ser responsable, en parte, 260 00:12:57,533 --> 00:12:59,155 de que esa lengua sobreviva, 261 00:12:59,155 --> 00:13:01,060 hasta el final del siglo o más. 262 00:13:02,591 --> 00:13:03,703 Muchas gracias, 263 00:13:03,703 --> 00:13:05,717 y quiero invitarlos a que hagan preguntas. 264 00:13:06,222 --> 00:13:08,373 (aplausos) 265 00:13:23,688 --> 00:13:24,977 *(persona 1) Gracias.* 266 00:13:24,977 --> 00:13:26,701 *- Gracias por su charla.* - Gracias. 267 00:13:26,701 --> 00:13:28,864 *(persona 1) Tengo una pregunta sobre los diccionarios.* 268 00:13:28,864 --> 00:13:31,107 *¿Dijo que trabajan con diccionarios impresos?* 269 00:13:31,107 --> 00:13:32,312 - Sí. *- (mujer 1) Mi pregunta* 270 00:13:32,312 --> 00:13:34,508 *es: ¿qué sacan de estos diccionarios* 271 00:13:34,511 --> 00:13:38,222 *y si deben lidiar con los derechos de autor?* 272 00:13:38,222 --> 00:13:41,060 Esperaba que fuera la primera pregunta que me harían. 273 00:13:41,060 --> 00:13:42,827 (risas) 274 00:13:42,827 --> 00:13:46,358 En primer lugar, para PanLex, 275 00:13:46,358 --> 00:13:50,244 tenemos, según los recursos legales que hemos consultado... 276 00:13:52,734 --> 00:13:57,466 Mientras que el arreglo y la organización de un diccionario tiene derechos de autor, 277 00:13:57,466 --> 00:14:03,260 la traducción en sí misma no se considera sujeta a esto. 278 00:14:04,170 --> 00:14:05,808 Un buen ejemplo es, por ejemplo, 279 00:14:05,808 --> 00:14:10,525 una guía telefónica se considera, al menos en la ley estadounidense, 280 00:14:10,956 --> 00:14:11,965 con derechos de autor. 281 00:14:11,965 --> 00:14:16,800 Pero decir que el teléfono de tal persona es tal número 282 00:14:16,800 --> 00:14:18,360 no está sujeto a derechos de autor. 283 00:14:21,666 --> 00:14:23,444 Entonces, como dije, 284 00:14:23,444 --> 00:14:25,311 según nuestros académicos jurídicos, 285 00:14:25,311 --> 00:14:27,333 así es cómo lidiamos con esto. 286 00:14:27,333 --> 00:14:30,666 Pero incluso si esto no es un argumento legal sólido, 287 00:14:30,666 --> 00:14:32,063 algo importante a recordar 288 00:14:32,063 --> 00:14:38,269 es que la mayoría de estos datos léxicos 289 00:14:39,355 --> 00:14:40,530 no tienen derechos de autor. 290 00:14:40,530 --> 00:14:42,822 Una cifra importante de estos no tienen derechos de autor, 291 00:14:42,822 --> 00:14:44,333 entonces se pueden usar. 292 00:14:44,333 --> 00:14:46,783 Y, por otro lado, a veces, por ejemplo, 293 00:14:47,311 --> 00:14:49,644 si trabajamos con un diccionario impreso recientemente, 294 00:14:49,646 --> 00:14:51,577 en vez de intentar escanearlo y hacerlo OCR, 295 00:14:51,577 --> 00:14:53,439 le mandamos un email a la persona que lo hizo. 296 00:14:53,439 --> 00:14:57,600 Y resulta que a la mayoría de los lingüistas les emociona 297 00:14:57,600 --> 00:14:59,600 que sus datos se hagan accesibles. 298 00:14:59,600 --> 00:15:01,267 Entonces dicen: "Claro, por favor, 299 00:15:01,267 --> 00:15:03,273 inclúyanlo todo y háganlo accesible". 300 00:15:05,533 --> 00:15:08,424 Como dije, tenemos, al menos, según nuestras opiniones legales, 301 00:15:08,424 --> 00:15:09,466 tenemos la capacidad, 302 00:15:09,466 --> 00:15:11,177 pero incluso si no se quiere hacer eso, 303 00:15:11,177 --> 00:15:15,644 es muy fácil dar acceso público a la información. 304 00:15:26,288 --> 00:15:28,470 *- (persona 2) Gracias. Hola* - Hola. 305 00:15:28,470 --> 00:15:29,830 *(persona 2) ¿Puede contarnos más* 306 00:15:29,830 --> 00:15:35,031 *sobre cómo la persona que habla bajo sorabo accede a la información?* 307 00:15:35,031 --> 00:15:38,355 *Específicamente, ¿cómo le llega esa información* 308 00:15:38,357 --> 00:15:40,977 *y cómo podría convencerlos* 309 00:15:40,977 --> 00:15:42,800 *de probar el...?* 310 00:15:42,800 --> 00:15:44,680 Una gran pregunta, y en realidad es 311 00:15:44,680 --> 00:15:46,266 una en la que pienso mucho también, 312 00:15:46,266 --> 00:15:49,759 porque creo que cuando hablamos de acceso a la información, 313 00:15:50,270 --> 00:15:53,244 en realidad hay múltiples pasos. 314 00:15:53,244 --> 00:15:56,288 Uno es la preservación de los datos, asegurarse de que no desaparezcan. 315 00:15:56,288 --> 00:15:58,911 Segundo, asegurarse de que sea interoperable, 316 00:15:59,177 --> 00:16:01,844 y de que se pueda usar. 317 00:16:01,844 --> 00:16:05,370 Y, tercero, asegurarse de que esté disponible. 318 00:16:05,631 --> 00:16:07,333 Entonces, en el caso de PanLex, 319 00:16:07,333 --> 00:16:09,755 tenemos una API que se puede usar, 320 00:16:09,755 --> 00:16:11,888 pero, obviamente, no la puede usar un usuario final. 321 00:16:11,888 --> 00:16:14,847 Pero también hemos desarrollado interfaces. 322 00:16:15,155 --> 00:16:19,727 Por ejemplo, si van a *translate.panlex.org*, 323 00:16:19,728 --> 00:16:22,711 pueden traducir en nuestra base de datos. 324 00:16:22,711 --> 00:16:25,864 Si quieren jugar con la API, vayan a *dev.panlex.org,* 325 00:16:25,866 --> 00:16:29,222 y si quieren pueden encontrar mucho en la API, o en *api.panlex.org*. 326 00:16:30,950 --> 00:16:32,542 Pero también hay otro paso. 327 00:16:32,544 --> 00:16:36,577 Aunque se haga completamente accesible toda la información 328 00:16:36,579 --> 00:16:40,542 con herramientas muy útiles para acceder a ella, 329 00:16:41,210 --> 00:16:43,244 si no se promocionan estas herramientas, 330 00:16:43,244 --> 00:16:45,058 entonces las personas no podrán usarlas. 331 00:16:45,058 --> 00:16:47,177 Honestamente, esto es... 332 00:16:48,827 --> 00:16:51,044 algo que no se habla lo suficiente, 333 00:16:51,044 --> 00:16:52,955 y no tengo una buena respuesta para esto. 334 00:16:52,955 --> 00:16:54,800 ¿Cómo nos aseguramos de que...? 335 00:16:55,022 --> 00:16:56,933 Por ejemplo, yo, recientemente, 336 00:16:56,933 --> 00:16:59,647 solo hace unos años me familiaricé con Wikidata, 337 00:16:59,647 --> 00:17:02,463 y es exactamente la clase de tema que me interesa. 338 00:17:02,970 --> 00:17:07,177 Entonces, ¿cómo nos promocionamos a los demás? 339 00:17:07,177 --> 00:17:08,780 La dejaré como una pregunta abierta. 340 00:17:08,780 --> 00:17:10,800 Como dije, no tengo una buena respuesta para esto. 341 00:17:10,800 --> 00:17:12,888 Pero, por supuesto, para hacerlo, 342 00:17:12,888 --> 00:17:14,880 aún debemos alcanzar los primeros pasos. 343 00:17:22,133 --> 00:17:24,777 *(persona 3) Si queremos tener una traducción automática,* 344 00:17:24,777 --> 00:17:27,822 *¿no necesitamos una memoria de traducción?* 345 00:17:27,827 --> 00:17:30,666 *No estoy seguro de que las palabras individuales* 346 00:17:30,666 --> 00:17:32,918 *que ponemos en Wikidata,* 347 00:17:32,918 --> 00:17:36,558 *estas frases cortas que ponemos en Wikidata,* 348 00:17:36,558 --> 00:17:41,130 *ya sea como elementos comunes o lexemas de Wikidata,* 349 00:17:41,130 --> 00:17:43,953 *sean suficientes para hacer una traducción apropiada.* 350 00:17:43,955 --> 00:17:46,600 *Necesitamos oraciones completas, por ejemplo, para...* 351 00:17:46,772 --> 00:17:48,320 *(Benjamin) Sí, absolutamente.* 352 00:17:48,577 --> 00:17:51,422 *(persona 3) ¿Y en dónde conseguimos esta estructura de datos?* 353 00:17:51,422 --> 00:17:55,177 *No estoy seguro de que, actualmente,* 354 00:17:55,177 --> 00:17:59,533 *Wikidata pueda manejar muy bien* 355 00:17:59,533 --> 00:18:03,066 *el problema de una memoria de traducción,* 356 00:18:04,324 --> 00:18:05,965 *translatewiki.net*, 357 00:18:05,965 --> 00:18:09,490 *para meterse en ese lapso de...* 358 00:18:12,111 --> 00:18:14,993 *¿Debemos hacer algo al respeto o...?* 359 00:18:15,000 --> 00:18:17,133 Sí, y de verdad aprecio la pregunta. 360 00:18:17,135 --> 00:18:18,715 Mencioné esto un poco antes, 361 00:18:18,715 --> 00:18:20,361 pero me encantaría reiterarlo. 362 00:18:21,356 --> 00:18:24,955 Precisamente, por esta razón PanLex trabaja con datos léxicos 363 00:18:24,955 --> 00:18:27,030 y por eso me emocionan los datos léxicos, 364 00:18:27,030 --> 00:18:29,935 en vez de... no, sino además 365 00:18:29,935 --> 00:18:35,207 de los motores de traducción automática y de la traducción automática en general. 366 00:18:35,900 --> 00:18:39,200 Como dijo usted, la traducción automática requiere datos específicos, 367 00:18:39,740 --> 00:18:43,123 y no están disponibles para la mayoría de los idiomas del mundo. 368 00:18:43,123 --> 00:18:44,966 Para la gran mayoría de los idiomas del mundo, 369 00:18:44,966 --> 00:18:46,379 simplemente no están disponibles. 370 00:18:46,650 --> 00:18:48,447 Pero no significa que debamos rendirnos. 371 00:18:48,447 --> 00:18:49,627 ¿Por qué? 372 00:18:51,260 --> 00:18:54,444 Si necesitara traducir el menú del restaurante turco, 373 00:18:54,755 --> 00:18:59,360 entonces la traducción léxica será una herramienta muy buena. 374 00:18:59,360 --> 00:19:01,715 No estoy diciendo que se pueda usar la traducción léxica 375 00:19:01,715 --> 00:19:04,600 para hacer una traducción de párrafo por párrafo perfecta. 376 00:19:04,600 --> 00:19:06,866 Con traducción léxica me refiero a palabra por palabra 377 00:19:06,866 --> 00:19:09,670 y la traducción palabra por palabra puede ser muy útil. 378 00:19:12,231 --> 00:19:14,708 Es curioso pensarlo, pero no teníamos acceso 379 00:19:14,708 --> 00:19:16,620 a una buena traducción automática. 380 00:19:16,620 --> 00:19:20,191 Nadie tenía acceso hasta muy recientemente. 381 00:19:20,191 --> 00:19:23,649 Y aún nos las arreglamos con los diccionarios, 382 00:19:23,649 --> 00:19:27,687 y son una fuente increíblemente buena. 383 00:19:28,311 --> 00:19:31,288 Y la información está disponible, ¿por qué no la ponemos a disposición 384 00:19:31,288 --> 00:19:34,377 del mundo en general y de los hablantes de estos idiomas? 385 00:19:36,422 --> 00:19:38,666 *(persona 4) Hola, ¿qué mecanismos utilizan* 386 00:19:38,666 --> 00:19:40,666 *cuando la comunidad en sí misma... Estoy aquí.* 387 00:19:40,666 --> 00:19:43,253 - ¿Dónde está? Bien. *- (persona 4) Sí, lo siento. (risas)* 388 00:19:43,253 --> 00:19:44,577 *...cuando la comunidad misma* 389 00:19:44,577 --> 00:19:47,320 *no quiere parte de sus datos en PanLex?* 390 00:19:47,320 --> 00:19:48,933 Muy buena pregunta. 391 00:19:48,933 --> 00:19:51,955 La manera en que trabajamos con eso 392 00:19:51,955 --> 00:19:56,287 es que si un diccionario se edita y se hace público, 393 00:19:56,666 --> 00:19:58,133 es un buen indicador. 394 00:19:58,133 --> 00:20:02,400 Se podría comprar en una tienda o en la biblioteca de la universidad, 395 00:20:02,400 --> 00:20:04,690 o en una biblioteca pública a la que todos pueden acceder. 396 00:20:04,690 --> 00:20:08,080 Es un buen indicador de que se tomó la decisión. 397 00:20:08,080 --> 00:20:11,577 *(persona 4) [inaudible]* 398 00:20:15,740 --> 00:20:18,266 *(persona 5) Por favor, [inaudible], hable con el micrófono.* 399 00:20:19,295 --> 00:20:20,447 ¿Puede repetirlo? 400 00:20:20,447 --> 00:20:23,307 *(persona 4) Los lingüistas no siempre tienen el permiso de la comunidad.* 401 00:20:23,307 --> 00:20:24,387 *Para poder publicar cosas,* 402 00:20:24,387 --> 00:20:27,533 *suelen publicarlas sin el consentimiento de la comunidad.* 403 00:20:27,533 --> 00:20:29,577 Eso absolutamente cierto. 404 00:20:29,577 --> 00:20:32,533 Diría que es... 405 00:20:32,533 --> 00:20:34,422 Suele ocurrir. 406 00:20:34,422 --> 00:20:36,770 Diría que, generalmente, una minoría de casos, 407 00:20:36,770 --> 00:20:40,955 más que nada confinados a Norteamérica, 408 00:20:40,955 --> 00:20:43,355 aunque a veces también en idiomas sudamericanos. 409 00:20:44,765 --> 00:20:46,488 Es algo que debemos tener en cuenta. 410 00:20:46,488 --> 00:20:49,288 Si nos dijeran, por ejemplo, 411 00:20:49,288 --> 00:20:52,377 que la información que está en PanLex 412 00:20:52,377 --> 00:20:56,330 no puede accederla todo el mundo, 413 00:20:56,330 --> 00:20:58,040 entonces, por supuesto, la quitaríamos. 414 00:20:58,040 --> 00:20:59,310 *(persona 4) Bien, bien.* 415 00:21:01,281 --> 00:21:02,451 Eso no significa, claro, 416 00:21:02,451 --> 00:21:04,391 que seguiremos las reglas de derechos de autor 417 00:21:04,391 --> 00:21:06,542 pero seguiremos a las comunidades tradicionales, 418 00:21:06,542 --> 00:21:08,157 y esa es la gran diferencia. 419 00:21:08,157 --> 00:21:10,252 *(persona 5) Sí, a eso me refiero.* 420 00:21:15,022 --> 00:21:16,755 Saca a colación un punto interesante, 421 00:21:16,755 --> 00:21:18,350 que es que... 422 00:21:18,844 --> 00:21:22,244 a veces hay una gran cuestión sobre quién habla en nombre de un idioma. 423 00:21:23,000 --> 00:21:27,911 Tuve la experiencia de visitar el sudoeste estadounidense 424 00:21:27,911 --> 00:21:29,755 y de colaborar con algunos grupos 425 00:21:29,777 --> 00:21:32,288 que trabajan con indígenas, con los idiomas pueblo. 426 00:21:36,053 --> 00:21:38,044 Existen aproximadamente 427 00:21:38,044 --> 00:21:40,220 seis idiomas pueblo, según cómo se los divida, 428 00:21:40,220 --> 00:21:41,955 que se hablan en esa área. 429 00:21:41,955 --> 00:21:44,022 Pero están divididos entre 18 pueblos diferentes 430 00:21:44,320 --> 00:21:47,066 y cada uno tiene su propio gobierno tribal, 431 00:21:47,066 --> 00:21:50,022 y cada gobierno puede tener una opinión diferente 432 00:21:50,022 --> 00:21:54,007 sobre si su idioma debe ser accesible o no para los forasteros. 433 00:21:56,626 --> 00:21:58,170 Como, por ejemplo, Zuni Pueblo, 434 00:21:58,170 --> 00:22:01,472 es un único pueblo que habla el idioma zuñi. 435 00:22:02,923 --> 00:22:05,274 Y les interesa mucho que su idioma vaya a todos lados, 436 00:22:05,274 --> 00:22:07,694 lo ponen en señales de tránsito y en todo, es grandioso. 437 00:22:07,694 --> 00:22:10,637 Pero en algunos de los demás idiomas, 438 00:22:10,644 --> 00:22:13,051 puede haber un grupo que diga: 439 00:22:13,051 --> 00:22:15,866 "No queremos que los forasteros tengan acceso a nuestro idioma". 440 00:22:15,871 --> 00:22:18,838 Pero luego tienen el pueblo vecino que habla el mismo idioma y dice: 441 00:22:18,838 --> 00:22:21,666 "Queremos que nuestro idioma sea accesible a los forasteros 442 00:22:21,666 --> 00:22:24,088 con el uso de estas herramientas tecnológicas, 443 00:22:24,088 --> 00:22:26,560 porque queremos que el idioma sobreviva". 444 00:22:26,560 --> 00:22:29,488 Y plantea una cuestión ética muy interesante. 445 00:22:29,488 --> 00:22:31,651 Porque si se dice por defecto: 446 00:22:31,651 --> 00:22:34,622 "Bien, lo quitaré porque este grupo dijo que lo quite", 447 00:22:34,622 --> 00:22:36,711 ¿no se está perjudicando al segundo grupo 448 00:22:36,711 --> 00:22:39,360 porque este activamente quiere que descartes estas cosas? 449 00:22:39,360 --> 00:22:42,755 No creo que sea una pregunta con una respuesta sencilla. 450 00:22:42,755 --> 00:22:44,955 Pero diría que, al menos en términos de PanLex... 451 00:22:44,955 --> 00:22:48,938 Y que conste que aún no nos hemos encontrado con esto, 452 00:22:48,938 --> 00:22:50,407 que yo sepa. 453 00:22:50,933 --> 00:22:52,920 Podría ser parcialmente porque... 454 00:22:53,666 --> 00:22:55,444 Volviendo a la pregunta de él, 455 00:22:55,666 --> 00:22:57,790 quizás debamos promocionar más. (risas) 456 00:22:58,660 --> 00:23:02,155 Pero, en general, hasta donde sé, 457 00:23:02,155 --> 00:23:04,488 esto no ha surgido. 458 00:23:04,488 --> 00:23:06,871 Pero nuestro plan de juego para esto es, 459 00:23:06,871 --> 00:23:10,975 si una comunidad dice que no quiere que su idioma esté en una base de datos, 460 00:23:10,975 --> 00:23:12,095 entonces lo quitamos. 461 00:23:12,095 --> 00:23:14,916 *(persona 4) Porque nos encontramos con eso en Wikidata y Wikipedia...* 462 00:23:14,916 --> 00:23:16,140 - ¿En serio? *- (persona 4) ...en comentarios.* 463 00:23:16,140 --> 00:23:17,407 - ¿En serio? *- (persona 4) Es un problema.* 464 00:23:17,407 --> 00:23:20,488 Sí, imagino que en especial en comentarios de fotos y ciertas cosas. 465 00:23:20,488 --> 00:23:21,900 *(persona 4) Correcto.* 466 00:23:27,177 --> 00:23:33,170 *(persona 6) Hola. Tenía una pregunta sobre la contribución abierta.* 467 00:23:34,087 --> 00:23:36,644 En cuanto a ir a pedirle a una comunidad 468 00:23:36,654 --> 00:23:40,480 *que anoten o añadan información para un conjunto de datos,* 469 00:23:40,480 --> 00:23:44,200 *algo que es un poco intimidante,* 470 00:23:44,711 --> 00:23:49,244 *como editor, solo veo las cosas que faltan.* 471 00:23:49,244 --> 00:23:53,242 *Pero si pasaré tiempo con cosas, con una idea,* 472 00:23:53,582 --> 00:23:56,672 *existe una lista de elementos prioritarios,* 473 00:23:57,755 --> 00:24:01,198 *supongo que es muy motivador en este aspecto.* 474 00:24:01,200 --> 00:24:04,222 *Y me dio curiosidad sobre si usted tenía un sistema* 475 00:24:04,222 --> 00:24:07,866 *que es, en esencia, conocemos los huecos en nuestros datos,* 476 00:24:07,866 --> 00:24:12,088 *tenemos prueba lingüística para saber que si tuviéramos* 477 00:24:12,088 --> 00:24:15,530 *estos anotados, causarían mayor efecto.* 478 00:24:15,530 --> 00:24:17,152 *Entonces, imagino* 479 00:24:18,202 --> 00:24:21,405 *que tener el lexema para "casa" es muy importante* 480 00:24:21,405 --> 00:24:24,977 *quizás no un lexema para un dato u otro.* 481 00:24:24,977 --> 00:24:28,947 *Pero quería saber si tiene eso, si es algo* 482 00:24:30,217 --> 00:24:35,480 *que podría usarse para impulsar estos esfuerzos comunitarios.* 483 00:24:35,840 --> 00:24:37,066 Muy buena pregunta. 484 00:24:37,200 --> 00:24:41,216 Una cosa que tiene de mucho Wikidata... 485 00:24:41,216 --> 00:24:44,666 Lo siento, disculpen, PanLex tiene muchas listas de Swadesh. 486 00:24:44,666 --> 00:24:47,511 Al parecer, tenemos la mayor colección de listas de Swadesh en el mundo, 487 00:24:47,511 --> 00:24:48,555 y es interesante. 488 00:24:48,555 --> 00:24:50,250 Si no saben lo que es una lista de Swadesh, 489 00:24:50,252 --> 00:24:56,238 básicamente es una lista regularizada de elementos léxicos 490 00:24:56,244 --> 00:25:00,040 que se pueden usar para analizar idiomas. 491 00:25:00,040 --> 00:25:02,730 Contienen conjuntos muy básicos. 492 00:25:02,730 --> 00:25:05,003 Existen un par de clases de listas de Swadesh diferentes. 493 00:25:05,003 --> 00:25:07,328 Pero hay 100 o 213 elementos 494 00:25:07,328 --> 00:25:08,911 y pueden contener 495 00:25:08,911 --> 00:25:12,777 palabras como "casa", "ojo" y "piel", 496 00:25:12,777 --> 00:25:14,444 y básicamente palabras generales 497 00:25:14,444 --> 00:25:16,331 que deberían encontrarse en cualquier idioma. 498 00:25:16,331 --> 00:25:19,888 Es un buen punto de partida 499 00:25:19,888 --> 00:25:22,988 para tener esa clase de datos disponibles. 500 00:25:29,090 --> 00:25:31,126 Ahora, como dije antes, 501 00:25:31,133 --> 00:25:33,600 aún no realizamos la contribución abierta 502 00:25:33,600 --> 00:25:36,066 y nos emociona mucho poder hacerla. 503 00:25:36,066 --> 00:25:37,554 Algo de lo que me emociona hablar 504 00:25:37,554 --> 00:25:38,993 con la gente de esta conferencia 505 00:25:38,993 --> 00:25:42,982 es cómo puede usarse la contribución abierta 506 00:25:42,982 --> 00:25:45,931 y la logística detrás de eso, 507 00:25:46,200 --> 00:25:48,867 y esta es la clase de preguntas que surgen. 508 00:25:51,288 --> 00:25:53,400 Creo que la respuesta que puedo darle 509 00:25:53,400 --> 00:25:55,376 es que tenemos una lista prioritaria... 510 00:25:55,376 --> 00:25:57,684 Algo que puedo decir es que tenemos una lista prioritaria 511 00:25:57,684 --> 00:25:59,730 cuando se trata de qué idiomas estamos buscando. 512 00:25:59,730 --> 00:26:02,222 Buscamos idiomas 513 00:26:02,222 --> 00:26:04,666 que actualmente no se sirven de soluciones tecnológicas, 514 00:26:04,666 --> 00:26:06,977 que suelen ser lenguas minoritarias, 515 00:26:06,977 --> 00:26:09,280 o habitualmente lenguas minoritarias, 516 00:26:09,280 --> 00:26:12,096 y entonces les damos prioridad. 517 00:26:13,916 --> 00:26:16,844 Pero, en términos de que los elementos léxicos individuales 518 00:26:16,851 --> 00:26:20,244 sean la manera general de conseguir nuevos datos 519 00:26:20,244 --> 00:26:22,977 es al ingerir el valor de un diccionario completo. 520 00:26:22,977 --> 00:26:25,911 Dependemos de la elección de los elementos léxicos 521 00:26:25,911 --> 00:26:29,333 del diccionario, en vez de decir que necesariamente 522 00:26:29,333 --> 00:26:31,500 estamos buscando la palabra para "casa" en cada idioma. 523 00:26:31,500 --> 00:26:35,000 Pero cuando se trata de la contribución abierta, necesitamos algo así. 524 00:26:35,000 --> 00:26:37,912 Entonces es una oportunidad para investigar y crecer. 525 00:26:40,044 --> 00:26:43,088 *(persona 7) Hola, soy Victor, y esto es asombroso.* 526 00:26:45,108 --> 00:26:46,888 *Ya que tiene diapositivas,* 527 00:26:46,888 --> 00:26:49,355 *¿podría hablar un poco sobre el estatus técnico* 528 00:26:49,355 --> 00:26:51,260 *que actualmente el flujo* 529 00:26:51,260 --> 00:26:57,022 *de datos o información de y hacia Wikidata y PanLex.* 530 00:26:57,022 --> 00:26:59,955 *¿Actualmente está implementado* 531 00:26:59,955 --> 00:27:03,888 *y cómo lidia con un lado y el otro* 532 00:27:03,888 --> 00:27:07,133 *o con la información de ciclo de retroalimentación* 533 00:27:07,140 --> 00:27:09,950 *entre PanLex y Wikidata?* 534 00:27:09,950 --> 00:27:13,733 No tenemos conexiones formales con Wikidata en este momento, 535 00:27:13,733 --> 00:27:15,343 y es algo que, de nuevo, 536 00:27:15,343 --> 00:27:17,824 me emociona contar a las personas en la conferencia. 537 00:27:17,824 --> 00:27:20,644 Hemos tenido interacciones con Wiktionary, 538 00:27:21,774 --> 00:27:24,720 pero Wikidata es una opción mejor, sinceramente, 539 00:27:24,720 --> 00:27:26,755 para lo que estamos buscando. 540 00:27:27,355 --> 00:27:29,201 Tener elementos léxicos directamente 541 00:27:29,201 --> 00:27:32,311 significa que debemos analizar y extraer menos datos. 542 00:27:32,933 --> 00:27:37,148 Entonces, la respuesta es: aún no, pero queremos. 543 00:27:37,148 --> 00:27:39,800 *(persona 7) Y si no, ¿cuáles son los obstáculos?* 544 00:27:39,800 --> 00:27:43,511 *Podemos ver que Wikidata ya soporta muchos idiomas,* 545 00:27:43,511 --> 00:27:46,533 *pero cuando busco en *translate.panlex.org*,* 546 00:27:46,533 --> 00:27:49,311 *parece que ustedes soportan muchas más variedades,* 547 00:27:49,311 --> 00:27:50,888 *muchas más que Wikidata.* 548 00:27:50,888 --> 00:27:53,316 *¿Cómo ve que haya un lapso* 549 00:27:53,316 --> 00:27:57,177 *entre la traducción o primero la traducción léxica,* 550 00:27:57,177 --> 00:28:00,155 *la aplicación versus el esfuerzo* 551 00:28:00,155 --> 00:28:03,777 *mientras se intenta mapear una estructura de conocimiento?* 552 00:28:03,777 --> 00:28:05,866 Mapear el conocimiento será muy interesante. 553 00:28:05,866 --> 00:28:07,336 Hemos tenido debates interesantes 554 00:28:07,336 --> 00:28:12,311 sobre la manera en que Wikidata organiza sus datos léxicos, 555 00:28:12,311 --> 00:28:13,777 sus datos léxicos, 556 00:28:13,777 --> 00:28:16,044 y cómo organizamos nosotros nuestros datos léxicos. 557 00:28:16,044 --> 00:28:20,933 Hay diferencias sutiles que requerirían una estrategia de mapeo, 558 00:28:21,460 --> 00:28:24,577 algunas no serán necesariamente automáticas, 559 00:28:24,577 --> 00:28:27,422 pero podríamos desarrollar técnicas para hacerlo. 560 00:28:27,422 --> 00:28:30,796 Usted dio el ejemplo de las variedades de la lengua. 561 00:28:30,796 --> 00:28:34,111 Tendemos a ser muy "separatistas" cuando se trata de variedades de lenguas. 562 00:28:34,111 --> 00:28:36,311 En otras palabras, si tenemos una fuente que dice 563 00:28:36,311 --> 00:28:38,755 que este es el dialecto que se habla 564 00:28:38,755 --> 00:28:41,695 en el lado izquierdo del río en Papúa Nueva Guinea, para este idioma, 565 00:28:41,695 --> 00:28:42,913 y tenemos otra fuente que dice 566 00:28:42,913 --> 00:28:45,014 que este es el dialecto hablado a la derecha del río, 567 00:28:45,016 --> 00:28:46,741 entonces los consideramos idiomas separados. 568 00:28:46,743 --> 00:28:51,095 Lo hacemos para preservar la mayor información posible. 569 00:28:52,222 --> 00:28:54,355 Poder mapear eso a cómo lo hace Wikidata... 570 00:28:54,355 --> 00:28:56,938 En realidad, me encantaría conversar 571 00:28:56,938 --> 00:29:00,696 sobre cómo se designan 572 00:29:00,696 --> 00:29:06,323 los idiomas en Wikidata. 573 00:29:08,145 --> 00:29:12,320 De nuevo, vamos con la estrategia "separatista". 574 00:29:13,856 --> 00:29:17,440 En términos generales, dependemos de los códigos ISO 6393, 575 00:29:17,866 --> 00:29:19,643 brindados por Ethnologue, 576 00:29:19,643 --> 00:29:23,840 y entonces cada código individual tiene permitido variedades adentro, 577 00:29:23,840 --> 00:29:29,098 ya sea variedades de escritura, regionales o dialectos sociales, etc. 578 00:29:30,240 --> 00:29:32,762 De nuevo, es una oportunidad para debatir y trabajar. 579 00:29:35,622 --> 00:29:39,466 *(persona 8) Hola, quisiera saber si tiene una fuente de OCR* 580 00:29:39,466 --> 00:29:44,533 *en especial porque hemos intentado hacer OCR en maya,* 581 00:29:44,533 --> 00:29:47,928 *y no obtenemos resultados.* 582 00:29:47,933 --> 00:29:49,933 *No comprende nada...* 583 00:29:49,933 --> 00:29:52,512 - ¡Sí! (risas) *- (persona 8) Y... sí.* 584 00:29:52,512 --> 00:29:56,078 *Entonces, ¿sus fuentes están disponibles?* 585 00:29:56,078 --> 00:30:00,288 *Y la otra es si, en la superposición de códigos ISO,* 586 00:30:00,288 --> 00:30:01,641 *como dicen a veces:* 587 00:30:01,641 --> 00:30:04,199 *"Ah, esto es un idioma y este es otro",* 588 00:30:04,199 --> 00:30:06,555 *pero hay fuentes que dicen otra cosa,* 589 00:30:06,555 --> 00:30:10,133 *como dijo usted, tienden a superponerse.* 590 00:30:10,133 --> 00:30:12,955 *Entonces, ¿cómo hace...? Sí.* 591 00:30:12,956 --> 00:30:15,155 Sí, es una pregunta asombrosa. 592 00:30:15,155 --> 00:30:17,120 Me gusta mucho. 593 00:30:17,120 --> 00:30:20,400 No tenemos una fuente OCR formalizada exactamente, 594 00:30:20,400 --> 00:30:23,533 lo hacemos fuente por fuente. 595 00:30:23,533 --> 00:30:26,266 Una de las razones es porque a veces tenemos fuentes 596 00:30:26,266 --> 00:30:27,955 que no necesitan que hagamos OCR, 597 00:30:27,955 --> 00:30:29,841 que están disponibles para algunos idiomas, 598 00:30:29,841 --> 00:30:32,766 y nos concentramos en esos porque requieren menos trabajo. 599 00:30:32,766 --> 00:30:35,000 Pero, obviamente, si queremos profundizar 600 00:30:35,000 --> 00:30:37,056 en unas de nuestras fuentes que están pendientes, 601 00:30:37,056 --> 00:30:40,896 necesitaremos desarrollar fuentes OCR más sólidas. 602 00:30:40,896 --> 00:30:43,968 Pero también hay otro aspecto, que es, como dijo usted... 603 00:30:44,400 --> 00:30:48,576 Las personas que diseñaron los motores OCR, 604 00:30:49,088 --> 00:30:52,672 creo que no saben cuánto se pueden someter a pruebas de esfuerzo. 605 00:30:52,672 --> 00:30:55,181 ¿Saben qué es divertido? 606 00:30:55,181 --> 00:30:57,690 Intentar hacer OCR con un diccionario ruso-tibetano. 607 00:30:58,600 --> 00:31:00,216 Resulta que es muy difícil... 608 00:31:01,503 --> 00:31:03,747 Nos rendimos y contratamos a alguien para tipearlo, 609 00:31:04,022 --> 00:31:05,641 y fue completamente posible. 610 00:31:05,641 --> 00:31:07,260 Y, en realidad, resulta 611 00:31:07,260 --> 00:31:10,266 que esta rusa asombrosa aprendió a leer tibetano 612 00:31:10,266 --> 00:31:12,755 para poder tipearlo, y fue muy genial. 613 00:31:15,333 --> 00:31:18,270 Creo que están tratando con cosas de la escritura latina, 614 00:31:18,270 --> 00:31:22,871 entonces creo que las soluciones de OCR que se pueden desarrollar son más sólidas, 615 00:31:22,871 --> 00:31:24,673 tratan con fuentes multilingües como esta 616 00:31:24,673 --> 00:31:26,991 y esperan conseguir un cuatro al azar, 617 00:31:26,991 --> 00:31:28,284 si estás tratando con algo 618 00:31:28,284 --> 00:31:30,560 como fuentes mayas del siglo XVI, con cuatro dígitos. 619 00:31:32,088 --> 00:31:37,600 Pero hay algunas fuentes 620 00:31:37,600 --> 00:31:40,111 que OCR probablemente nunca alcance 621 00:31:40,111 --> 00:31:42,244 o requieren una inmensa cantidad de trabajo, 622 00:31:43,200 --> 00:31:46,933 y en realidad utilizamos un poco esto ahora. 623 00:31:46,933 --> 00:31:48,800 Tenemos otro proyecto activo en PanLex 624 00:31:48,800 --> 00:31:53,533 para transcribir toda la literatura tradicional de Bali, 625 00:31:53,533 --> 00:31:57,952 y encontramos que en los manuscritos balineses 626 00:31:58,444 --> 00:31:59,644 no hay posibilidad de OCR. 627 00:31:59,644 --> 00:32:02,200 Entonces, hicimos que un grupo de balineses los tipearan, 628 00:32:02,200 --> 00:32:05,000 y se volvió un proyecto cultural muy genial en Bali, 629 00:32:05,000 --> 00:32:07,288 y se convirtió en noticia y esas cosas. 630 00:32:07,288 --> 00:32:09,084 Entonces, diría 631 00:32:09,084 --> 00:32:11,377 que no se debe depender del OCR necesariamente, 632 00:32:11,377 --> 00:32:12,577 sino que hay muchas opciones. 633 00:32:12,577 --> 00:32:15,160 Tener buenas soluciones de OCR sería bueno. 634 00:32:16,663 --> 00:32:20,992 Además, si alguien está interesado en la OCR multilingüe, 635 00:32:20,992 --> 00:32:22,635 por favor, venga a hablarme. 636 00:32:29,517 --> 00:32:31,377 *(persona 9) Muchas gracias por su presentación.* 637 00:32:32,007 --> 00:32:34,866 *Habló sobre la integración* 638 00:32:34,866 --> 00:32:37,060 *entre PanLex y Wikidata,* 639 00:32:37,060 --> 00:32:38,792 *pero no se adentró en lo específico.* 640 00:32:38,792 --> 00:32:42,701 *Entonces estaba revisando su licencia de datos y está bajo CC0.* 641 00:32:42,701 --> 00:32:44,210 - Sí. *- (persona 9) Es grandioso.* 642 00:32:44,210 --> 00:32:46,377 *Entonces, existen dos maneras posibles,* 643 00:32:46,377 --> 00:32:49,400 *podemos importar los datos* 644 00:32:49,400 --> 00:32:52,777 *o continuar algo similar a la manera de Freebase,* 645 00:32:52,777 --> 00:32:55,688 *donde tuvimos la base de datos completa de Freebase,* 646 00:32:55,688 --> 00:32:59,080 *la importamos y creamos un enlace,* 647 00:32:59,080 --> 00:33:03,955 *un identificador externo a la base de datos de Freebase.* 648 00:33:03,955 --> 00:33:08,397 *Entonces, si tiene algo en mente, ¿piensa algo parecido?* 649 00:33:08,397 --> 00:33:10,401 *¿O solo quiere hacer...* 650 00:33:15,291 --> 00:33:18,755 *una base de datos independiente que se enlace con Wikidata?* 651 00:33:18,755 --> 00:33:20,533 Sí, es una pregunta grandiosa 652 00:33:20,533 --> 00:33:23,282 y siento es un paso adelante 653 00:33:23,282 --> 00:33:25,648 de algunas de las cosas que he estado pensando, 654 00:33:25,648 --> 00:33:29,555 parcialmente porque, como dije, 655 00:33:29,955 --> 00:33:32,111 conseguir que las dos bases de datos funcionen juntas 656 00:33:32,111 --> 00:33:33,533 es un paso por sí mismo. 657 00:33:33,533 --> 00:33:35,332 Creo que el primer paso que podemos dar 658 00:33:35,333 --> 00:33:37,622 es literalmente unir nuestras habilidades. 659 00:33:37,911 --> 00:33:40,246 Tenemos mucha experiencia lidiando con cosas 660 00:33:40,246 --> 00:33:42,656 como clasificaciones de propiedades de lexemas individuales 661 00:33:42,656 --> 00:33:44,734 que me encantaría compartir. 662 00:33:45,864 --> 00:33:49,050 Pero ser capaz de enlazar las bases de datos sería maravilloso. 663 00:33:49,050 --> 00:33:50,808 Estoy interesado al 100 %. 664 00:33:50,808 --> 00:33:54,066 Creo que sería un poco más fácil 665 00:33:54,066 --> 00:33:56,022 desde Wikidata hasta PanLex, 666 00:33:56,022 --> 00:33:58,866 pero quizás soy parcial, porque veo cómo podría funcionar. 667 00:34:02,040 --> 00:34:06,088 Sí, básicamente, siempre que Wikidata esté cómodo 668 00:34:06,088 --> 00:34:09,620 con todas las licencias, o resolvamos algo juntos, 669 00:34:09,620 --> 00:34:12,057 entonces creo que sería una gran idea. 670 00:34:13,216 --> 00:34:16,235 Solo debemos encontrar maneras de enlazar los datos. 671 00:34:16,235 --> 00:34:22,234 Algo que imagino es que me encantaría que las ediciones de Wikidata 672 00:34:22,577 --> 00:34:26,088 se ingresaran de inmediato a la base de datos de PanLex, 673 00:34:26,088 --> 00:34:28,551 sin tener que, básicamente, 674 00:34:28,551 --> 00:34:30,786 reingresarlas cada vez... 675 00:34:30,786 --> 00:34:35,779 Hacer de Wikidata una interfaz de contribución pública con PanLex 676 00:34:35,779 --> 00:34:36,888 sería realmente asombroso. 677 00:34:36,888 --> 00:34:39,777 Y luego poder usar PanLex en traducciones inmediatas, 678 00:34:39,780 --> 00:34:42,224 poder hacer traducir a través de elementos léxicos de Wikidata 679 00:34:42,224 --> 00:34:43,770 sería glorioso. 680 00:34:55,288 --> 00:35:00,266 *(persona 10) Es como el proceso de auditoría de esta red semántica* 681 00:35:00,266 --> 00:35:03,808 *para cerrar huecos por inferencia.* 682 00:35:05,682 --> 00:35:09,733 *Si lo pensamos más, esta clase de traducción,* 683 00:35:09,733 --> 00:35:13,353 *¿cómo se lidia con la discordancia semántica* 684 00:35:13,355 --> 00:35:16,088 *y la discordancia gramática?* 685 00:35:16,088 --> 00:35:18,888 *Por ejemplo, si se intenta traducir algo al alemán,* 686 00:35:18,888 --> 00:35:21,933 *simplemente puedes colocar varias palabras juntas* 687 00:35:21,933 --> 00:35:25,986 *y alcanzar algo razonable,* 688 00:35:25,986 --> 00:35:29,184 *y, por otro lado, creo a veces que leo* 689 00:35:31,450 --> 00:35:38,450 *que no todos los idiomas tienen el mismo sistema granular* 690 00:35:38,450 --> 00:35:40,453 *para los colores, por ejemplo.* 691 00:35:41,577 --> 00:35:42,800 ¿Usted dijo que todo 692 00:35:42,800 --> 00:35:45,010 usa un sistema diferente para los colores o el mismo? 693 00:35:45,530 --> 00:35:48,377 *(persona 10) Recuerdo que es por la evolución del lenguaje* 694 00:35:48,377 --> 00:35:51,533 *que comenzaron con blanco y negro y luego...* 695 00:35:51,533 --> 00:35:53,333 Sí, la jerarquía del color. 696 00:35:53,333 --> 00:35:54,492 La jerarquía del color 697 00:35:54,492 --> 00:35:57,271 es una gran manera de ilustrar cómo funciona esto, ¿verdad? 698 00:35:57,977 --> 00:36:01,400 Básicamente, cuando se tiene un único idioma puente... 699 00:36:02,043 --> 00:36:04,822 es interesante cuando lees los ensayos sobre traducción automática 700 00:36:04,822 --> 00:36:08,000 porque a veces hablan sobre un idioma puente hipotético, 701 00:36:08,000 --> 00:36:09,826 y dicen: "Sí, hay un idioma puente", 702 00:36:09,826 --> 00:36:12,133 y luego lees el ensayo y dice: "Es el inglés". 703 00:36:12,133 --> 00:36:16,688 Entonces, lo que hace esta forma de traducción léxica 704 00:36:16,690 --> 00:36:20,362 al pasarla por diferentes idiomas intermedios 705 00:36:20,755 --> 00:36:26,142 es que tiene el efecto de lidiar con mucha ambigüedad semántica. 706 00:36:26,142 --> 00:36:28,426 Porque mientras lo pases por idiomas 707 00:36:28,426 --> 00:36:33,408 que contienen límites semánticos razonablemente similares a una palabra, 708 00:36:33,408 --> 00:36:37,038 entonces evitas el problema 709 00:36:37,038 --> 00:36:39,808 de introducir ambigüedad semántica mediante el idioma puente. 710 00:36:39,808 --> 00:36:43,266 Entonces, al usar la jerarquía del color como ejemplo, 711 00:36:43,266 --> 00:36:46,460 si tomas un idioma que tiene una sola palabra para verde y azul 712 00:36:46,460 --> 00:36:50,688 y la traduce a azul 713 00:36:50,688 --> 00:36:53,244 en tu único idioma puente 714 00:36:53,244 --> 00:36:54,477 y luego a otro idioma 715 00:36:54,477 --> 00:36:57,422 que tiene ambigüedades diferentes, 716 00:36:57,422 --> 00:37:00,283 entonces terminas introduciendo ambigüedad semántica. 717 00:37:00,283 --> 00:37:02,370 Pero si la pasas por un montón de otros idiomas 718 00:37:02,370 --> 00:37:05,660 que también contienen un único elemento léxico para verde y azul, 719 00:37:05,660 --> 00:37:10,666 entonces, básicamente, esa especificidad semántica 720 00:37:11,040 --> 00:37:16,990 se transmite al idioma resultante. 721 00:37:17,755 --> 00:37:20,666 En cuanto a los aspectos característicos gramaticales, 722 00:37:20,666 --> 00:37:23,488 PanLex, en su historia, fundamentalmente, 723 00:37:23,488 --> 00:37:28,960 ha recolectado lexemas, formas léxicas. 724 00:37:29,711 --> 00:37:31,800 Con eso, quiero decir, básicamente, 725 00:37:31,804 --> 00:37:33,905 lo que tienes como palabra clave para un diccionario. 726 00:37:34,800 --> 00:37:38,170 Esta vez no nos concentramos necesariamente 727 00:37:38,555 --> 00:37:40,955 en recolectar formas de variedades gramaticales, 728 00:37:40,955 --> 00:37:43,360 cosas como datos [de idiomas], etc. 729 00:37:43,360 --> 00:37:44,830 o el tiempo pasado y presente. 730 00:37:44,830 --> 00:37:46,487 Pero es algo que estamos mirando. 731 00:37:46,488 --> 00:37:48,420 Algo que siempre es importante recordar 732 00:37:48,420 --> 00:37:50,600 es que, debido a que nuestro foco en... 733 00:37:51,422 --> 00:37:54,490 está en los idiomas minoritarios marginados y en extinción, 734 00:37:55,000 --> 00:37:57,777 queremos asegurarnos de que algo esté disponible 735 00:37:57,777 --> 00:37:59,711 antes de perfeccionarlo. 736 00:38:01,621 --> 00:38:02,844 Una frase que me encanta es: 737 00:38:02,844 --> 00:38:04,927 "No dejes que la perfección sea enemiga de lo bueno", 738 00:38:04,927 --> 00:38:06,570 y eso que lo que pretendemos hacer. 739 00:38:06,570 --> 00:38:09,014 Pero estamos muy interesados en la idea 740 00:38:09,014 --> 00:38:12,266 de poder manejar formas gramaticales 741 00:38:12,266 --> 00:38:14,031 y traducir a través de formas gramaticales, 742 00:38:14,031 --> 00:38:15,665 y es algo que hemos investigado, 743 00:38:15,665 --> 00:38:17,468 pero aún no hemos implementado por completo. 744 00:38:25,350 --> 00:38:28,777 *(Persona 11) Entonces, de los 7.500 idiomas,* 745 00:38:30,448 --> 00:38:33,111 *supongo que dependen de diccionarios escritos para nosotros,* 746 00:38:33,111 --> 00:38:36,222 *pero ¿todos esos idiomas tienen formas escritas estándares* 747 00:38:36,222 --> 00:38:38,101 *y cómo lidian con...?* 748 00:38:38,101 --> 00:38:39,887 Es una buena pregunta. 749 00:38:42,111 --> 00:38:45,062 Sí, muchos de estos idiomas, 750 00:38:45,066 --> 00:38:47,977 como todos saben, son verbales. 751 00:38:47,977 --> 00:38:50,666 Pero cualquier idioma para el que se ha producido un diccionario 752 00:38:50,666 --> 00:38:52,466 tiene alguna clase de ortografía, 753 00:38:52,466 --> 00:38:56,710 y dependemos de la ortografía producida para el diccionario. 754 00:38:56,710 --> 00:38:59,686 Ocasionalmente, manipulamos ligeramente la ortografía 755 00:39:00,956 --> 00:39:03,177 si podemos garantizar que no tenga pérdidas. 756 00:39:03,177 --> 00:39:05,377 Pero tendemos a evitarlo tanto como sea posible. 757 00:39:07,533 --> 00:39:11,485 No nos metemos en el tema 758 00:39:11,485 --> 00:39:13,229 de desarrollar ortografías para los idiomas, 759 00:39:13,229 --> 00:39:14,967 porque a veces están desarrolladas, 760 00:39:14,967 --> 00:39:17,240 incluso aunque no estén publicadas. 761 00:39:17,240 --> 00:39:22,155 Entonces, por ejemplo, 762 00:39:22,155 --> 00:39:26,022 para muchos idiomas hablados en Nueva Guinea, 763 00:39:26,488 --> 00:39:29,125 puede que no haya una forma ortográfica utilizada comúnmente, 764 00:39:29,125 --> 00:39:30,980 pero a algunos lingüistas se les ocurre algo 765 00:39:30,980 --> 00:39:32,333 y es un buen primer paso. 766 00:39:33,409 --> 00:39:36,730 También recolectamos formas fonéticas cuando están disponibles en diccionarios, 767 00:39:36,730 --> 00:39:38,400 y esa es otra manera de entrar, 768 00:39:38,400 --> 00:39:40,533 una representación de la palabra en IPA, 769 00:39:40,533 --> 00:39:41,800 si está disponible. 770 00:39:41,800 --> 00:39:43,333 Eso también se puede usar. 771 00:39:43,333 --> 00:39:45,755 Pero normalmente no usamos eso como un puente 772 00:39:45,755 --> 00:39:48,226 porque introduce ciertas ambigüedades. 773 00:39:52,666 --> 00:39:55,466 *(persona 12) Gracias, puede que sea una pregunta muy tonta,* 774 00:39:56,044 --> 00:40:00,572 *pero ¿esos son solo los idiomas intermedios con los que trabajan?* 775 00:40:00,572 --> 00:40:02,215 No. No. 776 00:40:02,222 --> 00:40:03,674 *(persona 12) Sí, bien. Gracias.* 777 00:40:03,676 --> 00:40:05,948 No, me alegra que lo preguntara. Responde a la pregunta. 778 00:40:05,964 --> 00:40:11,311 Esta es una captura de pantalla de *translate.panlex.org*. 779 00:40:11,311 --> 00:40:12,826 Si haces una traducción, 780 00:40:12,826 --> 00:40:15,022 recibirás una lista de traducciones en el lado derecho. 781 00:40:15,022 --> 00:40:17,874 Haces clic en un botón de tres puntos y recibirás un gráfico como este. 782 00:40:17,874 --> 00:40:21,760 Y lo que muestra son los idiomas intermedios, 783 00:40:22,010 --> 00:40:24,133 los 20 principales por puntaje... 784 00:40:24,133 --> 00:40:26,093 Podría entrar en detalles sobre el puntaje, 785 00:40:26,093 --> 00:40:27,452 pero no es importante ahora... 786 00:40:27,452 --> 00:40:30,244 por el puntaje con que se usa. 787 00:40:30,244 --> 00:40:33,393 Pero para traducir, en realidad usamos mucho más que 20. 788 00:40:33,393 --> 00:40:35,797 Lo limité a 20 porque si tienes más... 789 00:40:35,797 --> 00:40:37,661 en realidad esto es una simulación de física, 790 00:40:37,661 --> 00:40:39,638 puedes mover las cosas y hacen garabatos. 791 00:40:39,638 --> 00:40:42,200 Si tienes más de 20, la computadora se altera. 792 00:40:45,400 --> 00:40:47,419 Entonces es una demostración, sí. 793 00:40:55,955 --> 00:40:57,888 *(persona 13) Leila, de la Fundación Wikimedia.* 794 00:40:57,888 --> 00:41:00,155 *Solo una nota sobre...* 795 00:41:00,155 --> 00:41:03,260 *Mencionó a la Fundación Wikimedia un par de veces en la presentación,* 796 00:41:03,260 --> 00:41:06,533 *quería saber si quiere hacer alguna clase de incorporación de datos* 797 00:41:06,533 --> 00:41:08,460 *o una colaboración con Wikidata,* 798 00:41:08,820 --> 00:41:11,200 *¿quizás Wikimedia Deutschland sería un lugar mejor* 799 00:41:11,200 --> 00:41:13,182 *para conversar?* 800 00:41:13,182 --> 00:41:16,256 *Porque Wikidata vive dentro de Wikimedia Deutschland* 801 00:41:16,256 --> 00:41:17,511 *y el equipo está allí,* 802 00:41:17,511 --> 00:41:19,971 *y además la comunidad de voluntarios de Wikidata* 803 00:41:19,977 --> 00:41:23,710 *sería el lugar perfecto para hablar* 804 00:41:23,710 --> 00:41:25,590 *sobre cualquier clase de incorporaciones* 805 00:41:25,590 --> 00:41:31,136 *o trabajar para acercar PanLex a Wikidata.* 806 00:41:31,577 --> 00:41:32,688 Grandioso, muchas gracias, 807 00:41:32,688 --> 00:41:34,901 porque, sinceramente, no estoy muy familiarizado 808 00:41:34,901 --> 00:41:37,823 con todas las complejidades de la arquitectura 809 00:41:37,823 --> 00:41:39,740 de cómo se relacionan todos los proyectos. 810 00:41:39,740 --> 00:41:41,977 Por las risas, supongo que es complicado. 811 00:41:41,977 --> 00:41:44,333 Pero, sí, básicamente, queremos hablar 812 00:41:44,333 --> 00:41:48,333 con quien sea responsable de Wikidata. 813 00:41:48,333 --> 00:41:52,120 Solo queremos localizar 814 00:41:52,860 --> 00:41:56,470 estamos interesados en hablar con quien sea responsable de Wikidata, 815 00:41:56,470 --> 00:41:58,264 que son todos ustedes, los voluntarios. 816 00:42:03,266 --> 00:42:05,044 ¿Hay más preguntas? 817 00:42:10,066 --> 00:42:14,400 Bien, si alguien tiene más preguntas después 818 00:42:14,400 --> 00:42:17,711 o de algo que hablé... los detalles y las especificaciones de estas cosas, 819 00:42:17,711 --> 00:42:19,800 por favor, vengan a hablarme, estoy muy interesado. 820 00:42:19,800 --> 00:42:23,977 En especial, si trabajan con algo que involucre elementos léxicos, 821 00:42:23,977 --> 00:42:28,666 algo que involucre idiomas minoritarios en extinción 822 00:42:28,666 --> 00:42:30,444 y lenguas marginadas, 823 00:42:30,444 --> 00:42:34,410 y además Unicode, también me dedico a eso. 824 00:42:36,220 --> 00:42:37,800 Muchas gracias, 825 00:42:37,800 --> 00:42:39,563 y gracias por invitarme a hablar, 826 00:42:39,563 --> 00:42:41,550 espero que lo hayan disfrutado. 827 00:42:41,550 --> 00:42:43,753 (aplausos)