[ Volver a Investigación ]
¿Quiénes somos?
Recursos
Investigación
Publicaciones
Actividades realizadas
Materiales pedagógicos
Materiales de estudio
Fichero Jorge Ibarra 
Cuadernos del Laboratorio
Otros laboratorios
Agenda
Contacto

"¿Me está usted preguntando...?" Umbrales melódicos en la percepción de preguntas y afirmaciones



Introducción
Esta investigación ha sido pensada especialmente con motivo del XVIII Congreso de la Sociedad Chilena de Lingüística, organizado por la Sochil, que se realizará en noviembre del año 2009.
Se ha diseñado en el Laboratorio de Fonética de la Facultad de Letras y en su ejecución participan profesores de la Facultad, alumnos de Licenciatura en Letras y alumnos del magíster en Lingüística.
Para el equipo del Laboratorio, esta será la primera investigación —nacida en esta unidad de experimentación— que se presentará ante la comunidad científica nacional.

Autores
Domingo Román, Camilo Quezada, Valeria Cofré, Josué Pino, Camila Gallegos, María Teresa Núñez.

Resumen
En esta investigación se examina desde el punto de vista de perceptivo el número de semitonos que permite distinguir una melodía ascendente final de una interrogación, del ascenso de una oración no concluida; paralelamente, se estudia el número de semitonos que debe existir en una cadencia para que se la perciba como afirmación, a diferencia de una oración no concluida.

Se trabajó con oraciones manipuladas de tal manera que el final es ascendente y descendente en varios grados. Las señales que sirvieron para la creación de los estímulos corresponden a dos voces masculinas (una más grave que la otra) y a dos voces femeninas (una más aguda que la otra). Con esto se tiene cuatro grupos de estímulos. Los valores iniciales de las emisiones masculinas se manipularon para que el inicio se situara exactamente en los 100 Hz y en los 150 Hz y los inicios de las voces femeninas se establecieron en los 200 Hz y en los 250 Hz. También se crearon estímulos a partir de los enunciados, constituidos solo por una síntesis de la frecuencia fundamental. De esta manera, la investigación consta de dos partes: la primera consiste en el estudio de la percepción de la melodía tonal en frases y, la segunda, el mismo estudio se realiza en tonos sintéticos. Por comodidad expresiva, nos referiremos a cada una de estas partes de la investigación como "prueba-frases" y "prueba-tonos"

Los informantes fueron personas chilenas de entre 18 y 25 años, de ambos sexos. Respecto de cada estímulo presentado, los informantes respondieron si se trataba de una afirmación, una frase inconclusa o una pregunta.

Los resultados muestran, para cada uno de los cuatro grupos de estímulos, el umbral diferenciador tanto en lo que corresponde a la percepción de la afirmación como de la pregunta en enunciados y en tonos. Se observan también las respuestas diferenciadas por sexo a los estímulos provenientes de voces masculinas y femeninas.

Etapas  y responsables

Revisión bibliográfica: Valeria Cofré
Creación de los estímulos: Domingo Román
Aplicación del instrumento: Domingo Román
Análisis de los datos: Camilo Quezada
Discusión de los resultados: Domingo Román

Carta Gantt

Carta Gantt para la investigación sobre umbrales st
Figura 1. Carta Gantt (para esta carta se ha usado el programa (libre) GanttProyect.

Avances

Prueba frases

Creación de estímulos

Para la creación de los estímulos se procedió a grabar cuatro emisiones de la expresión "viene mañana", dos de hombres y dos de mujeres, correspondientes más o menos a las tesituras deseadas (inicios en 100 Hz, 150 Hz, 250 Hz y 200 Hz). Luego se manipuló la curva tonal para dejarla estilizada de tal manera que en los cuatro casos tuviera el mismo contorno. Para esto se fijó el inicio en los Hz. ya mencionados y se situó un primer pico frecuencial hacia el final de la primera sílaba (tónica) elevado 5 st respecto del inicio. Luego se trazó el descenso hasta el inicio de la sílaba "ña", que corresponde al inicio del tonema. Ese punto se fijó en los mismos Hz del inicio de la emisión. Esta es la parte constante del experimento. La línea recta que va desde este punto hasta el final, se hizo variar en tramos de 1.5 st tanto en dirección ascendente como descendente. Esto es lo que se indica en la figura siguiente, que corresponde al ejemplo de la frase que se inicia en 200 Hz.

Modelo de curva melódica estilizada usada en la creación de los estímulos (frases)
Figura 2. Esquema de las melodías de las frases usadas en el experimento.

Implementación en Praat

Se decidió usar el método MFC, de Praat) para presentar los estímulos y para obtener las respuestas de los informantes. 

Paradeterminar el orden de presentación de los estímulos, se usó el método de aleatorización PermuteAll que permite presentar órdenes diferentes cada vez que se ejecuta la prueba.

Piloto

La implementación piloto de la prueba-frases se realizó entre el 1 y el 5 de septiembre. Los tres examinadores tomaron muestras con distinto número de estímulos: uno de ellos hizo la aplicación con 24 estímulos y dos lo hicieron con la totalidad (48 estímulos). Dos examinadores realizaron cuatro aplicaciones (dos a hombres y dos a mujeres) y uno aplicó cinco veces la prueba.
De esta manera, se obtuvieron 528 respuestas ((24 * 4) + (48 * 4) + (48 * 5)).

A partir de la aplicación del piloto se decidió trabajar con la totalidad de los estímulos (48).

Las interfaces definitivas del experimento con frases son las siguientes:

Primera pantalla en la prueba-frases Segunda pantalla: inicio del experimento
1. Primera pantalla 2. Inicio del experimento
El informante puede descansar Fin del experimento
3. Posibilidad de una pausa en la mitad del experimento 4. Fin del experimento
Figura 3. Interfaces de la prueba frases

A partir de los resultados de la aplicación piloto, se corrigieron algunos detalles de la implementación del experimento y para usar adecuadamente el sistema MFC que incluye la obtención de tablas con las respuestas por informante.

Aplicación

La prueba frases fue aplicada a 178 personas, todas entre 17 y 25 años, preferentemente estudiantes universitarios, de Santiago y de Valparaíso (47% de hombres y 53% de mujeres; promedio de edad = 21,02 años; desviación estándar = 2,2).
Dado que cada informantes respondió por 48 estímulos, obtuvimos un total de 8544 respuestas.

Ejemplos

Las siguientes frases fueron usadas en esta investigación y se exponen aquí a modo de ejemplo (estos ejemplos están en formato mp3, los originales estaban en formato wav). Se indica el número de semitonos (st) de asecenso (+) o descenso (-) y en el paréntesis, la frecuencia de inicio del estímulo (en Hz).
.

Ascendentes Audición (mp3) Descendentes Audición (mp3)
+ 1,5 st (100 Hz) - 1,5 st (200 Hz)
+ 3,0 st (200 Hz) - 3,0 st (100 Hz)
+ 4,5 st (250 Hz) - 4,5 st (150 Hz)
+ 6,0 st (150 Hz) - 6,0 st (250 Hz)
+ 7,5 st (100 Hz) - 7,5 st (200 Hz)
+ 9,0 st (200 Hz) - 9,0 st (100 Hz)



Procesamiento de los datos

Se construyeron dos tablas de contingencia para cada una de las cuatro series de estímulos (definidas por la frecuencia de inicio, o sea, 100 Hz, 150 Hz, 200 Hz y 250 Hz). Una de estas tablas cruzaba la variable "respuesta del informante" (esta respuesta era del tipo "pregunta", "afirmación" u "otra") y la variable "movimiento tonal" (que corresponde a la zona manipulada al final de cada frase y que adopta valores entre -9 st y + 9 st). La otra tabla de contingencia incorpora la variable "sexo del informante".

Resultados

1. Respuestas generales por frecuencia

La siguiente tabla muestra cuántas respuestas se obtuvo para cada alternativa (afirmación, otra, o pregunta) en función de la cantidad de Hz que caracterizaba al esímulo (100, 150, 200 ó 250).

Frecuencia de inicio Afirmación Otra Pregunta
100 1174 357 605
150 1004 429 703
200 977 464 695
250 992 382 762
Tabla 1. Cantidad de respuestas para afirmaciónotrapregunta, ordenadas por la frecuencia de inicio del estímulo.

Los mismos datos se observan en el gráfico siguiente.
Respuestas ordenadas por frecuencia de inicio del estímulo
Figura 4. Gráfico con los valores de la tabla anterior

Comentario: Se observa un patrón invertido en las respuestas de los informantes en función de la frecuencia de inicio del estímulo. En los estímulos de 100 Hz, la cantidad de respuestas afirmación es mayor que cuando la frecuencia de inicio es 250 Hz. A la inversa, las calificaciones de pregunta son menos en los estímulos que se iniciaban en los 100 Hz y son más cuando el estímulo tiene la frecuencia de inicio más alta (250 Hz).


Los resultados generales se presentan en los gráficos siguientes ordenados por la frecuencia de inicio de los estímulos y expresados porcentualmente.


resultados estímulos 100 Hz inicio
REsultados generales a los estímulos de 150 Hz de inicio
Resultados de los estímulos de 200 Hz de inicio Resultados estímulos 250 Hz inicio
Figura 5. Resultados generales ordenados por frecuencia de inicio de cada serie de estímulos y presentados en porcentaje.

Comentarios 

    1. Las respuestas obtenidas para frecuencia de inicio más baja (100 Hz) tiene un corportamiento relativamente distinto a las demás.

    2. La respuesta afirmación muestra una tendencia más clara que la respuesta pregunta: el porcentaje es alto y relativamente estable, en torno al 80%. En tanto, la respuesta pregunta manifiesta una variación correlativa al aumento de los semitonos. En otras palabras, La categoría pregunta no se comporta de manera tan discreta como la afirmación.

    3. Para los estímulos de inicio en 150 Hz, 200 Hz y 250 Hz, lo más  parecido a un umbral perceptivo se produce a partir de los -3 st de descenso en el caso de la respuesta afirmación.

    4. Para los estímulos de inicio en 100 Hz, ese umbral se sitúa a partir del primer grado de descenso, es decir, -1,5 st, en el caso de la respuesta afirmación.

    5. No resulta evidente un umbral semejante en el caso de la respuesta pregunta.

2. Respuestas desglosadas por sexo de los informantes

Las respuestas presentadas anteriormente se pueden desglosar en función del sexo de los informantes para comparar los resultados desde este punto de vista. Esto se muestra en las figuras 6a, 6b, 6c y 6d.

Respuestas hombres/mujeres estímulos inicio 100 Hz
Figura 6a. Respuestas a los estímulos con inicio en 100 Hz.
Respuestas hobres/mujeres estímulos inicio 150 Hz
Figura 6b. Respuestas a los estímulos con inicio en 150 Hz.
Respuestas hombres/mujeres estímulos inicio 200 Hz
Figura 6c. Respuestas a los estímulos con inicio en 200 Hz.
Respuestas hombres/mujeres estímulos inicio 250 Hz
Figura 6d. Respuestas a los estímulos con inicio en 250 Hz.

Comentarios

1. En general, tal como se dijo en el análisis general, se confirma que la respuesta afirmación tiene una tendencia más clara que la respuesta pregunta.

2. Para los estímulos con frecuencia de inicio en los 100 Hz, las mujeres comienzan a percibir a partir del primer grado de descenso, es decir, de los -1,5 st. En todos los demás casos, este umbral, tanto para hombres como para mujeres, se puede postular en los -3 st.

3. Pareciera haber un umbral para la respuesta pregunta situado en los 3 st  en el caso de lo estímulos de frecuencia más alta (250 Hz) percibidos por los informantes masculinos.

4. En el caso de las mujeres interpretando los estímulos de 250 Hz, se produce una especial simetría en la distibución de las respuestas entre los -1,5 st y los 1,5 st.

 

Presentación

La investigación fue presentada en el XVIII Congreso de la Sociedad Chilena de Lingüística, el jueves 5 de noviembre. Los encargados de representar al equipo de trabajo fueron Camila Gallegos, Josué Pino y Domingo Román (en las fotografías siguientes).

Presentador Josué Pino Presentadora Camila Gallegos Presentadores del trabajo
Josué Pino Camila Gallegos Los tres presentadores: Josué, Camila y Domingo

Comentarios recibidos

Realizada la presentación el equipo de investigadores recibió, entre otros, los siguientes comentarios:

El doctor Héctor Ortiz Lira se refirió a la probable dificultad de los informantes para responder otra (como algo diferente de pregunta y de afirmación). Manifestó que por tratarse de un grupo entonativo independiente es más difícil para el informante categorizar el ascenso melódico final.

Por correo electrónico, complementó su opinión de la siguiente manera:

Por ejemplo, en "Básicamente es eso" un descenso en "…eso" va a ser interpretado en primer lugar como afirmación independiente. Pero si empiezo a descender en "Bási"… y subo en "…eso", talvez al sujeto no se le ocurra que puede ser una aseverativa dependiente (y que concluye con un descenso en, por ej, "si se dan todos los resultados") e incluso una aseverativa que implica, y que por lo tanto puede o puede no ser concluida con otro texto. Recodemos que las implicancias pueden o pueden no ser expresadas —quedan como en el aire.

El doctor Mario Bernales preguntó por la posible incidencia de la variedad dialectal del informante ya que es muy posible que las curvas melódicas que son normalmente producidas por un hablante ejerzan influencia en la percepción. Mencionó que en su zona de trabajo, se escuchan con cierta frecuencia enunciados afirmativos con melodía ascendente. También manifestó la necesidad de continuar estudios como estos que indaguen en la percepción de las cuestiones prosódicas y sugirió considerar siempre diferentes dialectos.

El doctor Ómar Sabaj señaló que la pregunta tiene funciones pragmáticas muy variadas y que tal vez esta razón podría explicar el  comportamiento menos categorial que el de la afirmación. También complementó su participación con un correo electrónico en el que manifiesta lo siguiente:

La explicación detallada que se me ocurre es esta y me permito exponerla, humildemente, por si en alguna medida sirve para probar hipótesis o preguntas de investigación futura.

El supuesto inicial es que los umbrales melódicos de percepción tienen una relación con las funciones comunicativas, actos de habla determinados o pares mínimos típicos. Pero además sabemos que en el uso del lenguaje existen los actos de habla indirectos en los que una expresión que tiene una forma lingüística definida expresa una función distinta a la que típicamente expresa; por ejemplo, una 'orden' por una 'invitación' ("Anda a mi casa" o "Tómate una trago"). Una pregunta por una petición ("¿Puedes traerme un trago?"), etc. Los umbrales melódicos de percepción jugarían un rol central dentro de los recursos del lenguaje para procesar el potencial de indirección o indirectness de una expresión lingüística.

Entonces se me ocurre que en la medida que este potencial de indirección sea menor, más definido será el umbral de percepción de una acción y creo que uno puede hacer más cosas con las preguntas que con las afirmaciones; por lo tanto, estas últimas tendrían un potencial de indirección menor que las preguntas. En este sentido, percibir y determinar el valor de un acto que tiene un potencial de indirección mayor sería adaptativamente relevante en el lenguaje y por lo tanto su umbral de percepción siempre va ser más difuso e indeterminado.

Insisto eso sí en que esto es solo una hipótesis preliminar


Beatriz Quiroz nos ha escrito el siguiente comentario:

Estimado Domingo: me parecen muy interesantes los datos que han encontrado y lo relaciono con Halliday, quien está ahora muy implicado en estudios probabiliísticos sobre rasgos gramaticales desde una perspectiva sistémica. Él diría que tu estudio confirma que en el lenguaje la opción entre cláusulas declarativas e interrogativas, dentro del sistema lingüístico general,  está skewed - no sé cómo se dirá en castellano, pero Halliday supone que hay dos alternativas: o las opciones en el lenguaje son 50/50 o son skewed, o sea, cargadas a una de las dos en una relación que es básicamente siempre la misma, algo así como 90/10). Las declarativas (o afirmativas en tu terminología) son, por lo tanto, las esperadas dentro del sistema (y por los hablantes) en la amplia mayoría de los casos, en contraste con las interrogativas que, por lo tanto, son marcadas.

En cuanto a lo que Ómar Sabaj llama "nivel pragmático", la Lingüística sistémica funcional tiene otra manera de mirar el asunto: una cosa es el nivel lexicogramatical (en el que se ubican las distinciones que te expongo arriba), específicamente en el sistema de MODO), y otra es el semántico-discursivo (donde se ubica el sistema de FUNCIONES DE HABLA). Ambos sistemas, en distintos niveles o "estratos", se conectan en el lenguaje de manera sistemática. Las preguntas "indirectas" son realizaciones 'no-congruentes' de peticiones de información (en la terminología de Halliday, las peticiones de información son "preguntas"). Estas, en el nivel semántico-discursivo, "se realizan" o manifiestan congruentemente en cláusulas interrogativas del estrato lexicogramatical. Digo "congruente" porque es la forma "por defecto" pero no quiere decir que siempre se dé esa relación tal cual, por supuesto: las "preguntas" (en tanto peticiones de información) se pueden "realizar" con distintos recursos gramaticales, por ejemplo, mediante cláusulas declarativas (o "informativas" siguiendo otra propuesta para MODO) (hay que considerar que según Halliday las preguntas son estrictamente peticiones de información. Las peticiones de bienes y servicios son "órdenes").

Como esto es muy relevante para lo que estoy haciendo en este mismo momento, me permito pensar en voz alta: sería interesante analizar en el nivel superior al de las FUNCIONES DE HABLA, la conexión con el sistema de NEGOCIACIÓN (Martin 1992), porque la tensión entre estratos (en este caso, la tensión entre "funciones de habla" y "modo de la cláusula") se explica de manera más satisfactoria, al menos en teoría, al explorar cómo los hablantes emplean los recursos en el diálogo, en las que se negocia "información" o "bienes y servicios" de manera interactiva. Digo "de manera más satisfactoria", porque el supuesto suele ser que los hablantes hacen preguntas indirectas por mero antojo pero, al menos en la teoría, hay relaciones sistemáticas entre los estratos semántico-discursivo y lexicogramatical. Se ha estudiado bastante para el inglés pero no para el español. Yo recién estoy en la relación entre gramática (el sistema de MODO) y el estrato semántico-discursivo de las funciones de habla, pero lo que quiero hacer es mirar diálogos y ver cómo se negocian los significados (opciones) interpersonales y, por lo tanto, cómo se conectan los niveles en castellano. Esto para mí es fundamental porque de este modo puedo determinar los rasgos (u "opciones") gramaticales que son propios del español, sin tener que tomar así sin más las del inglés.

Volviendo al asunto de la investigación que presentan, creo que dentro del sistema interpersonal en el mismo estrato lexicogramatical, tu investigación es relevante en la exploración de las conexiones entre el sistema de MODO y el sistema de MODALIDAD.


Referencia
Martin, J. R. 1992. English Text: system and structure, Amsterdam, Benjamins.

 

 

 

Campus San Joaquín; avenida Vicuña Mackenna 4860; teléfonos: 354 1260 - 354 7904; fax: 354 7907