El Molino Labs lo componen unas herramientas que Molino de Ideas pone a disposición del usuario con el objetivo fundamental de crear un espacio lingüístico de investigación y aprendizaje, donde los usuarios puedan conocer el idioma a través de una perspectiva que ponga el acento en la parte lúdica, práctica e interactiva del aprendizaje de una lengua, en este caso del español.
Así mismo, aunque estas aplicaciones se dirigen a cualquier persona interesada en el español y en jugar con el lenguaje, en el ámbito de la educación Molino Labs está pensado especialmente para suministrar herramientas tanto a docentes como a estudiantes, ya sea para la creación de materiales didácticos o la investigación, como para la práctica de ejercicios que sirvan de refuerzo para el estudio de la lengua española.
Al hablar, articulamos sonidos que combinamos de una determinada manera, formando estructuras llamadas sílabas. Podemos imaginarnos que estas estructuras que tienen las palabras son cajas donde se pueden meter ciertas combinaciones de sonidos. Para que un sonido o un grupo de sonidos se meta en una caja, debe tener ciertas características, es decir, las cajas no aceptan cualquier combinanción de sonidos. Cada palabra por lo tanto tiene cajas con sus sonidos dentro. Pero además, en cada palabra hay una caja que pesa más que el resto y que para pronunciarla por lo tanto se debe hacer más esfuerzo. La caja que pesa más es la que lleva la sílaba tónica.
En español tenemos un sistema de acentuación para indicar la sílaba tónica y representar así cómo se pronuncia una palabra aunque no la hayamos oído antes, por eso el Silabeador es capaz de determinar la sílaba tónica a partir de la acentuación de la palabra.
Las reglas que sigue el Silabeador para saber cómo se reparten los sonidos en sílabas, son el reflejo de la fonotáctica del español, es decir, los rasgos segmentales y suprasegmentales que caracterizan al español, sus sonidos, su prosodia, etc.
En español podemos saber cómo se acentúa una palabra que no hayamos visto nunca a partir únicamente de su pronunciación. Esto es gracias a las normas de acentuación que determinan cuándo una palabra se acentúa gráficamente y cuándo no.
El acentuador conoce estas reglas y las aplica a cualquier palabra, existente o inventada, pero no conoce la pronunciación de las palabras ni cómo se escriben de antemano.
Por eso, para que el acentuador haga su trabajo le tenemos que indicar cómo se pronuncia una palabra, a partir de las sílabas en las que se divide, y la sílaba tónica. Con eso puede determinar la acentuación gráfica que tiene una palabra en base a las reglas ortográficas de acentuación.
El masculinizador funciona aplicando las reglas de transformación del español para cambiar del género femenino al masculino. Puesto que el género es una propiedad gramatical que responde a criterios arbitrarios hemos pensado que sería divertido crear esta herramienta para ver qué pasaría si cambiásemos el género de las palabras.
Como puedes comprobar hay algunas terminaciones en español que son propias del género común y por lo tanto no se ven afectadas (por ejemplo la terminación -ista: tenista, futbolista, violinista) y otras terminaciones que no son exclusivas y por lo tanto son susceptibles de verse afectadas por las reglas, así tendríamos divertidos disparates como que el masculino de persona es persón o persono... (Absténganse de jugar los puristas, riesgo de infarto por trauma lingüístico).
Qué ocurriría si diésemos hormonas a las palabras y pudiesen variar su género aunque no existiese siempre su correlato en el género contrario? (quizá enloqueciesen algunos políticos de alegría). El español tiene una serie de reglas para construir el femenino de las palabras.
Hay palabras que construyen su género a través de diferentes morfemas: chico/chica, poeta/poetisa; otras como los heterónimos tienen raíces diferentes: mujer/hombre, toro/ vaca; y una mayoría para las que simplemente es un aspecto gramatical sin conexión alguna con el sexo del referente, y por lo tanto no varían.
El feminizador aplica las reglas de transformación que usamos en español para cambiar del masculino al femenino para que podamos hacer pruebas de cómo se verían ciertas palabras en otro género. (Absténganse de jugar los puristas, riesgo de infarto por trauma lingüístico).
A partir de reglas lingüísticas Genaro predice el género que podría tener una palabra. Es importante saber que no están metidas de antemano las palabras junto con los respectivos géneros, sino que, analizando las diferentes terminaciones de los sustantivos y adjetivos que introduzcamos, Genaro determinará su género gracias a que conoce qué terminaciones admite el género en español.
El objetivo es enseñar a Genaro para que acabe teniendo las mismas intuiciones lingüísticas que pudiese tener un hablante de español, y que aunque sea una palabra inventada o nueva, pueda aventurar su género correspondiente.
Un corpus lingüístico es un gran conjunto ordenado de textos que sirve, entre otras cosas, como muestra de los usos reales de las palabras, lo que permite usarlos como base para la investigación de determinados comportamientos lingüísticos.
En este primer experimento hemos recopilado un corpus a partir de textos de diferentes periódicos. Hasta ahora contamos con un total de 1.727.211 artículos, que en total suman 660.465.835 palabras.
Para trabajar con este corpus habrá que tener en cuenta que muchas características del lenguaje que observaremos serán propias del género periodístico, por ejemplo características diafásicas (de registro), o diatópicas (según la procedencia de los textos).
Para hacer consultas al corpus puedes elegir entre una serie de patrones. Los comodines del asterisco (*) y la interrogación (?) son muy útiles. Por ejemplo si los combinas en una búsqueda de este tipo: abs*? el sistema buscaría todas las palabras de cualquier longitud que empezasen por abs-, lo que nos permitiría trabajar con palabras derivadas, buscar una determinada combinación de sonidos, etc. La búsqueda por proximidad, por otro lado, nos permitiría por ejemplo estudiar las frecuencias con la que una palabra aparece en compañía de otra.
El singularizador funciona aplicando reglas automáticamente para obtener el singular de una palabra a partir de su plural. Para obtener el singular de una palabra en plural básicamente influyen dos aspectos: la terminación de la palabra y la posición de la sílaba tónica.
Así que a partir de estos dos rasgos el Singularizador aplica las reglas para que puedas aprender los procedimientos para obtener los singulares de las palabras. El singularizador en algunos casos te sugerirá diferentes morfemas de número según las posibilidades que admita la palabra. En algunos casos, sin un conocimiento previo de la palabra no se puede conocer su singular real.
Por ejemplo el singular de céspedes, podría ser tanto césped como céspede, pues ambas formas harían el plural igual (a la inversa ocurriría con acorde, borde,alcalde...). Como nos interesa desentrañar las peculiaridades del lenguaje y poder automatizarlo no queremos mostrar el resultado correcto, sino los posibles.
Para construir el plural de las palabras el español tiene una serie de reglas (y unas excepciones a esas reglas). El pluralizador funciona aplicando a las palabras estas reglas de manera automática según las características que presente. Para la formación del plural básicamente influyen dos aspectos: la terminación de la palabra y la posición de la sílaba tónica.
Así que a partir de estos dos rasgos el Pluralizador aplica las reglas para que puedas aprender los procedimientos de formación del plural. Normalmente el plural como puedes comprobar se formará añadiendo -s, -es, o no añadiendo nada. Hay algunas excepciones que no responden a las reglas ordinarias, como es el caso del plural de algunas palabras latinas que mantienen su forma original (el corpus > los corpora).
El pluralizador no sólo sugerirá las posibilidades del plural de la palabra introducida, sino que también tendrá en cuenta las modificaciones en la acentuación de la palabra (canon > cánones).
Numara es capaz de predecir a partir de reglas lingüísticas el número que podría tener una palabra. Gracias a esto podemos meter cualquier palabra, aunque sea inventada, y predecir el número que presumiblemente tendría en español.
El objetivo es que Numara dé la misma respuesta que daría un hablante de español ante una palabra desconocida, es decir, queremos que Numara tenga las intuiciones lingüísticas de una persona cuya lengua materna sea el español.
Numara determina el número de las palabras gracias a que conoce la posibilidad que tiene cada terminación para ser singular, plural o invariable, a partir del análisis de las diferentes terminaciones de las palabras que se introducen.
En español contamos con una estructura muy productiva para crear palabras, muchas de ellas son usadas como insultos. Esta estructura consiste en usar un verbo en tercera persona del singular del presente de indicativo más un sustantivo en plural.
El Insultador genera automáticamente insultos a partir de ese patrón. A veces coincidirán con insultos existentes (como chupatintas, majagranzas, aguafiestas o todos los relacionados con el verbo comer). Otras veces coincidirán con sustantivos que también tienen esa estructura (cascanueces, parachoques, lavavajillas…).
Pero lo más importante es que el Insultador generará nuevos insultos que acaben con el monopolio de los insultos tan poco originales y gastados que estamos acostumbrados a oír actualmente...
* Este insulto fue creado de manera automática por el Insultador, lamentamos cualquier sensibilidad dañada, pero nosotros no limpiamos la lengua, nos dedicamos a dejarnos fascinar por sus potencialidades...
Con esta herramienta puedes resolver crucigramas atendiendo únicamente a su forma sin tener en cuenta el significado.
También te puede servir para crear tus propios crucigramas, pero sobre todo esta herramienta está orientada a que puedas investigar sobre el léxico en español, de manera que puedas descubrir las palabras que encajan según los patrones que elijas. Es decir, por un lado seleccionas el número de letras que deben tener las palabras y por otro eliges la posición que deben ocupar determinadas letras. Si atendemos a la parte gráfica de las palabras, éstas son una combinación de letras, que van variando de posición y de número. Ahora puedes comprobar qué relación guardan unas con otras y cómo se construyen.
Un anagrama, además de un emblema formado por letras, también es la trasposición de las letras de una palabra que da como resultado la formación de otra palabra. Hay una larga tradición anagramática que muchas veces se ha relacionado con significados ocultos, o con el poder mágico de las palabras. Pero también ha sido un pasatiempo, un entretenimiento lúdico que ha dado juegos como el scrabble.
El anagrama que más se suele usar como ejemplo es el de la palabra Roma, que combinando sus letras da: amor,mora, Omar, armo y ramo. Muy relacionado con los anagramas también están los palíndromos, que sería una especie de arquitectura especular de un anagrama: “dábale arroz a la zorra el abad”. Si te interesa el tema de los anagramas mira este enlace al blog del Molino donde podrás aprender más sobre la historia del anagrama.
La lematización es un proceso que consiste en la identificación de la forma canónica de una palabra, es decir, su lema. Esta técnica es muy usada a la hora de extraer información de un texto de forma automática ya que para la recuperación de datos es muy útil reducir las variantes morfológicas que puede presentar una palabra y ayudar así a los motores de búsqueda a obtener los mejores resultados de la forma más eficiente, permitiendo mayor flexibilidad en las búsquedas y evitando redundancia en los resultados. Un lematizador es capaz de separar la ráiz o lexema de una palabra de sus correspondientes terminaciones, de tal manera que puede asociar a una misma palabra las diferentes formas que se obtienen como resultado de la adición de sufijos. Generalmente la lematización trabaja sobre los morfemas de género y número, al que se pueden añadir otros como en el caso de los verbos de persona, tiempo, etc. Es decir, un lematizador identifica los atributos finales que puede tener una palabra según su pertenecia a una determinada categoría gramatical para llegar al lema.
Uno de los problemas de la lematización es la ambigüedad que encontramos a la hora de asociar una forma a una categoría gramatical determinada. Es muy frecuente el sincretismo de formas. Por ejemplo, podemos encontrar dos formas idénticas como toque, que pertenecen a dos categorías gramaticales diferentes: una es un sustantivo y la otra es una forma del verbo tocar. A la hora de buscar en los diccionarios tradicionales deberíamos buscar por un lado toque, y por otro tocar, para llegar a sendos significados.
Siguiendo los niveles de referencia para el español fijados por el Instituto Cervantes, según las recomendaciones que propuso el Consejo de Europa en el Marco Europeo de Referencia para las lenguas, hemos clasificado las palabras en un nivel básico (A1-A2), uno intermedio (B1-B2), y uno avanzado (C1-C2). A través del nuevo Molinolab Ciervantes podrás aumentar tu vocabulario y preparar exámenes de español.
La herramienta está pensada para docentes, discentes y curiosos. El objetivo que se persigue con esta herramienta es facilitar al usuario la adquisición de léxico de acuerdo a su nivel, sus necesidades y sus intereses.
Refranario es nuestro diccionario sobre refranes y frases hechas. De él salió el GominoLab sobre refranes, en el que puedes unir la primera parte de un refrán con su final. Ya que tenemos eso, ¿por qué no dar rienda suelta al humor y permitir que los refranes se unan de manera promiscua?
Nuestra bases de datos generan de manera automática nuevas construcciones basadas en refranes. Desde el absurdo de cada oveja con sangre entra o el que calla engorda, pasando por el significativo una golondrina no hace nada hasta llegar al posible refrán las apariencias han caído o compartir es poder.
Como el mítico juego de Cifras y letras, el objetivo de esta herramienta es conseguir las palabras que se puedan formar a partir de unas letras dadas o bien de otra palabra. Las posibilidades combinatorias a veces son tan numerosas que hemos tenido que limitar la cantidad de palabras que puedes visualizar. Si lo piensas, con la combinación de 27 letras nos sobra para crear todo el vocabulario que necesitamos (hay mucha variación entre el número de vocablos que puede manejar una persona en su propio idioma, según ciertos lexicógrafos oscila entre 20.000 y 40.000, siendo más del doble el número de entradas que podemos encontrar en un diccionario normal, y muchas, muchas más, si tenemos en cuenta las acepciones que puede haber en cada entrada).
En breve podrás disfrutar de un nuevo gominolab que pondrá a prueba tu capacidad para formar palabras, el entrenamiento idóneo si estás pensando en ir a concursar a algún programa televisivo...
Estamos acostumbrados a organizar las palabras atendiendo a un criterio de ordenación alfabética, tal como aparecen en los diccionarios. Pero existen otras muchas maneras de organizar las palabras según las características que presentan. El rebuscador te permite hacer búsquedas a través de la selección de una serie de patrones de diferente índole. Trabajar la morfología-entre otras cosas-, ya no será lo mismo...
¿Qué palabras contienen "v" y "b" ? ¿Cuáles empiezan y acaban por las mismas letras? ¿Qué prefijos y sufijos se usan con determinados lexemas? Éstas y miles más son las preguntas que podrás resolver con el Rebuscador. Otra herramienta que te permitirá crear materiales relacionados con la lengua, satisfacer tu curiosidad investigando sobre el español y profundizar sobre las peculiaridades de este idioma.
Tanto en el genial juego del Scrabble como en la vida real, no todas las palabras tienen el mismo valor. Con esta herramienta podrás conocer las máximas puntuaciones posibles para cada situación del tablero. Una ayuda más para tramposos, pero esperemos que también para todo amante de este clásico juego.
Exagerardo es el rey de la exageración: su especialidad es encontrar el adjetivo del que deriva cualquier superlativo, es decir, dada una forma terminada en ísimo, ísima, ísimos, ísimas, Exagerardo encuentra el adjetivo en grado positivo del que deriva.
Las reglas de formación de superlativos no son triviales (ni trivialísimas). En algunos casos, el sufijo se pega directamente a la base (como en dificilísimo), en otros se elimina la última vocal (como en sanísimo) y si la palabra termina en R o N es necesario intercalar una C (jovencísimo, irregularcísimo). Exagerardo conoce estas reglas, y por lo tanto es capaz de dar con el adjetivo original del que deriva cualquier superlativo.
Don Benito es orginario de Lilliput y su debilidad son los diminutivos: Don Benito es especialista en encontrar la palabra de la que deriva cualquier diminutivo. Introduce cualquier diminutivo que termine en ito/a, illo/a y Don Benito encontrará el sustantivo o adjetivo del que deriva.
Como ocurre con los superlativos, las reglas de formación de diminutivos no son tan simples como cabría pensar. En algunos casos, el sufijo se pega directamente a la base (como en facilito), en otros se elimina la última vocal (como en sillita) y según la terminación de la palabra, el número de sílabas y la presencia de diptongos, pueden intercalarse interfijos como EC, C o CEC (hombrecito, cuerpecito, pececito, florecilla). Don Benito conoce estas reglas, y no hay diminutivo que se le resista.
El Analizador de mentes es un psicoanalista de habilidades prodigiosas. El Analizador escrutina y disecciona las mentes, pero no de cualquier mente. En concreto, El Analizador de mentes analiza los adverbios terminados en -mente.
Los adverbios terminados en -mente derivan siempre de un adjetivo. De hecho, estos adverbios surgieron a partir del sustantivo mente precededido de un adjetivo. Es decir, construcciones formadas por el sustantivo mente y un adjetivo, como clara mente ("con la mente clara") acabaron fusionándose y dando lugar al adverbio claramente. Puesto que mente es un sustantivo femenino, el adjetivo acompañante debía ir también en femenino. Aunque actualmente esta construcción es percibida como una unidad indivisible y fosilizada (no como la suma de un adjetivo en femenino+mente), lo cierto es que seguimos creando adverbios en mente al mismo ritmo que se generan adjetivos nuevos y siguiendo las mismas pautas de formación: de ojiplático, ojipláticamente.
El Analizador de mentes analiza el adverbio introducido y devuelve el adjetivo del que deriva (en su forma lematizada, es decir, en masculino singular). Tenéis más información sobre el origen de los adverbios terminados en mente aquí.
El vocabulario puede organizarse por diferentes criterios: por orden alfabético, por categoría gramatical, por significados, por origen... Pero ninguno de estas informaciones te podrá responder qué palabra es la que más usamos en español, o si para un extranjero es mejor aprender comenzar o empezar. O qué forma del verbo ser es la más frecuente: ¿soy? ¿es? ¿seré?
Frecuentímetro analiza las palabras según la cantidad de veces que aparece en un inmenso grupo de textos. Las palabras están divididas en 10 bloques, ordenadas de las más frecuentes a aquellas que aparecen una o aquellas otras que no reconocemos como palabras. Puedes ver los 10 bloques y las denominaciones que les hemos dado en la tabla de abajo.
Introduce cualquier palabra en la caja de texto, clicka el botón y recibe el dato sobre la frecuencia de la palabra.
Rango numérico
Rango textual
Ejemplo
10
imprescindible
ayer
9
básica
música
8
diaria
respuesta
7
normal
despertar
6
peculiar
densidad
5
infrecuente
estufa
4
inusual
libelo
3
extraña
devengo
2
rara
guiñote
1
hápax
tifácea