information

Type
Soutenance de thèse/HDR
duration
38 min
date
December 10, 2015

Soutenance de thèse devant un jury composé de :
Mme Elaine Chew , Rapporteure
M. Davide Luigi Ferrario, Rapporteur
M. Massimo Ferri, Examinateur
M. Jean-Louis Giavitto, Examinateur
M. Moreno Andreatta, co-Directeur de thèse
M. Goffredo Haus, co-Directeur de thèse

Is it possible to represent the horizontal motions of the melodic strands of a contrapuntal composition, or the main ideas of a jazz standard as mathematical entities? In this work, we suggest a collection of novel models for the representation of music that are endowed with two main features. First, they originate from a topological and geometrical inspiration; second, their low dimensionality allows to build simple and informative visualisations.

Here, we tackle the problem of music representation following three non-orthogonal directions. We suggest a formalisation of the concept of voice leading (the assignment of an instrument to each voice in a sequence of chords) suggesting a horizontal viewpoint on music, constituted by the simultaneous motions of superposed melodies. This formalisation naturally leads to the interpretation of counterpoint as a multivariate time series of partial permutation matrices, whose observations are characterised by a degree of complexity. After providing both a static and a dynamic representation of counterpoint, voice leadings are reinterpreted as a special class of partial singular braids (paths in the Euclidean space), and their main features are visualised as geometric configurations of collections of 3-dimensional strands.

Thereafter, we neglect this time-related information, in order to reduce the problem to the study of vertical musical entities. The model we propose is derived from a topological interpretation of the Tonnetz (a graph commonly used in computational musicology) and the deformation of its vertices induced by a harmonic and a consonance-oriented function, respectively. The 3-dimensional shapes derived from these deformations are classified using the formalism of persistent homology. This powerful topological technique allows to compute a fingerprint of a shape, that reflects its persistent geometrical and topological properties. Furthermore, it is possible to compute a distance between these fingerprints and hence study their hierarchical organisation. This particular feature allows us to tackle the problem of automatic classification of music in an innovative way. Thus, this novel representation of music is evaluated on a collection of heterogenous musical datasets.
Finally, a combination of the two aforementioned approaches is proposed. A model at the crossroad between the signal and symbolic analysis of music uses multiple sequences alignment to provide an encompassing, novel viewpoint on the musical inspiration transfer among compositions belonging to different artists, genres and time. To conclude, we shall represent music as a time series of topological fingerprints, whose metric nature allows to compare pairs of time-varying shapes in both topological and in musical terms. In particular the dissimilarity scores computed by aligning such sequences shall be applied both to the analysis and classification of music.


Outils dynamiques et topologiques pour l’analyse musicale

La modélisation d’un processus créatif est une tâche complexe. Il est en effet difficile de définir une fonction capable d’évaluer de manière objective les résultats produits. Cette caractéristique fait de la réalisation de modèles formels pour l’analyse et la classification musicale un objectif intéressant. Dans ces recherches, l’étude du processus compositionnel est considéré comme une base pour la formalisation et l’implémentation d’un modèle d’analyse et de classification cohérent, qui soit à la fois robuste et sensible aux nuances stylistiques propres au domaine musical.

L’essence d’une composition musicale peut être vue comme une collection de plusieurs concepts musicaux intelligibles. Un compositeur modèle sa pièce en faisant varier ces concepts dans le temps. On peut penser par exemple à l’utilisation en musique des phénomènes de tension et de résolution qui attirent l’attention de l’auditeur, le focalisent sur des événements spécifiques, déroutent son attente par des changements inattendus, ou soutiennent ses intuitions à l’aide d’une cadence qui lui est familière, un motif rythmique répétitif, ou encore une mélodie cantabile. Ces fonctions musicales de base sont saisies de manière plus ou moins consciente par l’auditeur.

Notre approche de l’analyse musicale est basée sur l’hypothèse que la composition d’une pièce repose principalement sur deux actions. Le philosophe et musicologue Ernst Kurth dans Grundlagen des Linearen Kontrapunkts décrit le contrepoint comme “[. . .] an equilibrium among streaming linear forces (kinetic energy) and congealing harmonics forces (potential energy)”.
Les expressions énergie cinétique et énergie potentielle offrent une double perspective sur la musique et ne doivent bien entendu pas être traduites littéralement en termes scientifiques. D’un côté, une force horizontale produit un mouvement qui caractérise la superposition des lignes mélodiques dans le contrepoint. De l’autre côté, il est possible d’un point de vue vertical d’interpréter harmoniquement l’information musicale, qui était auparavant étendue dans la dimension temporelle.

Jusqu’à présent, la majorité des travaux visant à aborder l’analyse musicale d’un point de vue mathématique ont recours à des approches algébriques, ou empruntés à la théorie des catégories. Par ailleurs, le signal audio s’est révélé constituer un centre d’intérêt particulier en informatique aboutissant à la fondation du Music Information Retrieval (MIR).
Les algorithmes utilisés pour l’analyse de signaux audio proviennent fréquemment d’applications initialement développées pour le traitement d’images. Nos travaux proposent d’appliquer à l’analyse et la classification musicale des outils issus de la topologie et conçus pour l’analyse de formes complexes et de données. En particulier, l’intérêt porté par la communauté mathématique à la persistance topologique a augmenté de manière surprenante au cours de la dernière décennie. Ce domaine, qui trouva sa première application en computer vision, fournit des outils rigoureux pour s’attaquer au problème de la comparaison des formes, grâce à une représentation métrique de leurs propriétés géométriques et topologiques.

La dimensionnalité faible des modèles proposés dans ces travaux offre une description mathématique des propriétés du processus compositionnel sous la forme de visualisations intuitives. Le problème à été divisé en deux parties, en accord avec l’interprétation musicale proposée par Kurth. Dans un premier temps, on formalisera le concept de conduite des voix d’un point de vue algébrique et géométrique, pour ensuite le décrire en termes de séries temporelles multivariées. Une deuxième approche nous permettra de représenter les propriétés musicales persistantes au niveau symbolique comme à un niveau d’interaction signal-symbolique.

speakers


share


Do you notice a mistake?

IRCAM

1, place Igor-Stravinsky
75004 Paris
+33 1 44 78 48 43

opening times

Monday through Friday 9:30am-7pm
Closed Saturday and Sunday

subway access

Hôtel de Ville, Rambuteau, Châtelet, Les Halles

Institut de Recherche et de Coordination Acoustique/Musique

Copyright © 2022 Ircam. All rights reserved.