39 1 4MB
UNIVERSIDAD NACIONAL DE QUILMES Acústica y Psicoacústica
Terrile Germán Andrés
Análisis sobre los sonidos de las aves
OBJETIVOS
Se pretende realizar un análisis sobre distintos sonidos producidos por aves. Por un lado ver la composición de los mismos, tanto espectral como formal y por otro lado buscar indicios que permitan demostrar la formación de melodías y si las supuestas notas utilizadas tienen relación alguna con las notas musicales de la escala temperada. METODO DE TRABAJO Como material primario de análisis se utilizaron entre ocho y diez grabaciones de entre cinco y diez minutos cada una. Las grabaciones fueron tomadas en el parque que rodea El Rosedal desde distintos puntos. Se utilizó un grabador digital Tascam dr-‐40 y un micrófono Audio Technica AT-‐897. Del material obtenido se descartó lo que no servía para la investigación y se hizo una selección de cinco pequeños fragmentos. En cada uno de ellos se observan resultados dispares y se analizaron desde distintos puntos de vista. El análisis se realizó con el programa Adobe Audition 3.0.
2
1. GENERACION DEL SONIDO EN LAS AVES Se dará una breve descripción del aparato encargado de generar sonidos en las aves y sus principales elementos. Los elementos básicos que lo componen son: pulmones, bronquios, siringe, tráquea, laringe, boca y pico [Fig 1].
Fig 1. Partes encargadas de generar sonidos en las aves.
El sistema generador de sonidos de las aves a diferencia del del humano, no posee de cuerdas vocales, sino que posee la siringe. La siringe es un órgano que tiene la particularidad de poder generar dos sonidos simultáneamente. El aire proveniente de los pulmones pasa por los bronquios y al llegar a la siringe, por medio de las vibraciones de sus dos membranas, se genera el sonido que continua por la tráquea. El poseer dos membranas hace que pueda generar sonidos con una sola de ellas, con ambas o parte del sonido con una y parte con la otra. Este órgano permite que las aves puedan realizar distintos tipos de sonidos y como se verá mas adelante, cada uno de ellos posee una composición espectral particular. 2. CLASIFICACION GENERAL A modo general, los sonidos de las aves se dividen en dos tipos: cantos y llamadas. Los cantos son mas elaborados, poseen una estructura mas compleja y las llamadas son sonidos mas simples y mecánicos.
3
Fig 2: Composicion formal del canto.
Fig 3: Llamadas.
3. ANALISIS En el primer fragmento a analizar {Audio 1}[Fig 4], vemos que el sonido resultante es un canto que tiene varias partes y que es una sinusoide. Del siguiente fragmento se tomaron como referencia de análisis aquellos puntos que estén a los extremos de la línea melódica, inferior y superior.
Fig 4: Canto sinusoidal. Analisis con tamaño de ventana 2048 Hamming.
En el siguiente cuadro se comparan las frecuencias obtenidas en los recuadros del 1 al 4 con las frecuencias de notas musicales.
4
Canto vs. Notas Musicales 4000 Hz.
3000 2000 1000 Notas Musicales
0 Nota 1
Nota 2
Canto Nota 3
Nota 4
Canto
Nota 1 3120
Nota 2 2051
Nota 3 2762
Nota 4 2344
Notas Musicales
3136
2093
2793
2349
Del cuadro anterior se puede ver que la nota uno corresponde al Sol 3136 hz., la nota dos al Do 2093 hz., la nota tres al Fa 2397 hz. y la cuatro al Re 2349 hz. y que el porcentaje de error en la entonación es de 0,51%, 1,95%, 1,1% y 0,21% respectivamente. Para tener una referencia de la precisión en la entonación, el porcentaje de error entre la nota musical y su semitono anterior es de 5,7%, 5,6%, 5,5% y 5,6% respectivamente. En todos las notas analizadas, el error es menor al cuarto de tono. El segundo fragmento a analizar {Audio2} es una llamada, se ve en su contenido espectral la simplicidad en la forma y la replicaciones en distintas bandas de la nota fundamental [Fig 5].
Fig 5. Llamada con una zona de fundamental indefinida y sus réplicas. Analisis con tamaño de ventana 2048 Hamming.
A simple vista se puede decir que es un sonido armónico basándonos en su contenido espectral, aunque en la zona de los 4500hz. y 6000hz. no esté definida la información. Esto se debe a que, a diferencia del caso anterior donde a la sinusoide se le puede asignar una frecuencia determinada en un punto determinado del tiempo, esta llamada no tiene una fundamental, sino que tiene una zona de fundamental indefinida[Fig 6]. Se observa que la llamada hace un
5
pequeño descenso de entonación y a medida que continua agrega información en la zona de la fundamental.
Fig 6. Zona de fundamental indefinida. Análisis con tamaño de ventana 2048 Hamming. PARCIALES LIMITE INFERIOR (Hz) 1er parcial 2do parcial 3er parcial 4to parcial
1395 2903 4414 5718
LIMITE SUPERIOR (Hz) 1583 3037 4563 6050
Fig 7. Limites de frecuencias de los cuatro parciales.
En el cuadro de análisis de frecuencia [Fig 8] se ven las cuatro zonas donde hay información.
Fig 8. Analisis de frecuencia. Analisis con tamaño de ventana 4096 Kaiser.
El tercer fragmento a analizar {Audio 3} presenta en la zona de la fundamental, tres fundamentales independientes que se replicaran en el espectro de manera mas o menos armónica [Fig 9]. Como se puede observar, este sonido posee una fundamental mucho mas grave que las anteriores y presenta mayor cantidad de parciales que los casos anteriores.
Fig 9. Tres fundamentales.
Fig 10. Espectro completo.
6
Analizando en detalle los distintos parciales que se presentan se pudo ver que algunos de ellos corresponden a la fundamental mas grave (322,9 hz.), otros a la fundamental intermedia (403,9 hz.) y otros a la fundamental mas aguda (489,8 hz.) pero que no todos guardan una relación armónica precisa con sus fundamentales. Según la magnitud de estas imprecisiones, los parciales analizados se organizan en tres grupos. a. una diferencia muy pequeña entre el parcial y el valor ideal correspondiente a dicho parcial. Ej.: el sexto parcial de la serie con fundamental en 403,9 hz. es 2422 hz. cuando idealmente debería ser 2423,4 hz. Esto es un error del 0,05%. Caso similar es el del quinto parcial de serie con fundamental en 322,9 hz. donde el error es del 0,15%. Los parciales incluidos en este grupo se entienden prácticamente como ideales. b. Diferencia mayor a la del primer grupo. Ej.: el segundo parcial de la serie con fundamental en 489,8 hz. es 968,9 hz. cuando debería ser 979,6 hz. Error del 1,1%. Caso similar es el del cuarto parcial de la primera serie donde el error es del 0,8%. c. Parcial no considerado. En este grupo se ubican los parciales que no poseen valores significativos como para ser considerados, ya sea por diferencia en la frecuencia o por la escasa amplitud en esa región del espectro. Parciales del seis en adelante en la serie con fundamental en 322,9 hz. y del cinco en adelante en la serie de 489,8 hz.
7
Fig 11. Tres fundamentales y sus replicas en el espectro. Analisis con tamaño de ventana 16384 Kaiser.
Evolucion de las Fundamentales 4000 3500 3000 Hz.
2500 2000 1500 1000 500 0
P1
P2
P3
P4
P5
P6
P7
P8
P9
Series 1 322,9
645,9
968,9
1302
1612
0
0
0
0
Series 2 403,9
810,1
1219
1612
2016
2422
2826
3227
3631
Series 3 489,8
968,9
0
1962
0
0
0
0
0
De las tres series armónicas, la que presenta parciales mas fieles es la que tiene como fundamental 403,9 hz. donde casi todos sus parciales pertenecen al primer grupo, siendo 0,6% el máximo error en toda la serie. En cuanto a la vinculación con notas musicales, la fundamental 403,9 hz. tiene un error del 2,7% con el Sol sostenido de frecuencia 415,3 hz. La fundamental 322,9 hz. tiene un error del 2% con el Mi de frecuencia 329,6 hz. y la fundamental 489,8 tiene un error del 1% con respecto al Si de frecuencia 493,8 hz.. En el {Audio 4} se pueden escuchar las tres fundamentales aisladas.
8
En el último audio a analizar {Audio 5} se puede comprobar como las aves son capaces de crear melodías y de recrearlas reiteradamente. Este fragmento pertenece a un canto y se pueden distinguir los elementos descriptos en la [Fig 2].
4. CONCLUCIONES De los fragmentos analizados, se puede concluir lo siguiente: a. Son muy diversos los sonidos que pueden realizar las aves. Desde sonidos puramente sinusoidales, sonidos con componentes armónicos y con componentes no del todo armónicos. b. En los cantos de las aves, las notas utilizadas se asemejan a las notas utilizadas por los humanos en frecuencia. En un caso se vio que las notas producidas son semejantes a las de la escala diatónica (notas Do, Re, Fa y Sol) y en otro caso las tres fundamentales superpuestas eran cercanas a las notas Mi, Sol sostenido y Si. c. Las aves son capaces de generar melodías, recordarlas y repetirlas fielmente. 5. BIBLIOGRAFIA Härmä, A. & Somervuo, P. (2004), “Classification of the harmonic structure in bird vocalization”. Fagerlun, S. (2004), “Automatic Recognition of Bird Species by Their Sounds”, Master Thesis, HUT, Laboratory of Acoustics and Audio Signal Processing.