C85

From SAS
Jump to: navigation, search

Template:Brève description Template:Développer allemand 'Analyse de concept formelle' ( 'FCA' ) est une manière fondée sur des principes de dériver une hiérarchie de concept ou formelle ontologie à partir d'une collection de objets et de leurs propriétés. Chaque concept de la hiérarchie représente les objets partageant un ensemble de propriétés; et chaque sous-concept de la hiérarchie représente un sous-ensemble des objets (ainsi qu'un sur-ensemble des propriétés) dans les concepts au-dessus. Le terme a été introduit par Rudolf Wille en 1981 et s'appuie sur la théorie mathématique de réseaux et ensembles ordonnés qui a été développée par Garrett Birkhoff et d'autres dans les années 1930.

L'analyse de concept formelle trouve une application pratique dans des domaines tels que exploration de données, exploration de texte, apprentissage machine, gestion des connaissances, web sémantique, développement de logiciels , chimie et biologie.

Présentation et historique

La motivation originale de l'analyse de concept formelle était la recherche d'une signification réelle des mathématiques théorie de l'ordre. Une telle possibilité de nature très générale est que les tableaux de données peuvent être transformés en structures algébriques appelées «réseaux complets», et que ceux-ci peuvent être utilisés pour la visualisation et l'interprétation des données. Un tableau de données qui représente une relation hétérogène entre les objets et les attributs, tabulant les paires de la forme "l'objet" 'g' 'a l'attribut "" m "", est considéré comme un type de données de base. Il s'agit d'un «contexte formel». Dans cette théorie, un «concept formel» est défini comme une paire («A», «B»), où «A» est un ensemble d'objets (appelé «étendue»).) et «B» est un ensemble d'attributs («l'intention») tels que

  • l'étendue A se compose de tous les objets qui partagent les attributs dans B , et dually]
  • l'intention B se compose de tous les attributs partagés par les objets dans A .

De cette manière, l'analyse conceptuelle formelle formalise les notions sémantique de extension et intension.

Les concepts formels de tout contexte formel peuvent, comme expliqué ci-dessous, être ordonné dans une hiérarchie appelée plus formellement le «réseau conceptuel» du contexte. Le réseau conceptuel peut être visualisé graphiquement sous la forme d'un "diagramme linéaire", qui peut ensuite être utile pour comprendre les données. Cependant, ces réseaux deviennent souvent trop volumineux pour être visualisés. Ensuite, la théorie mathématique de l'analyse conceptuelle formelle peut être utile, par exemple, pour décomposer le réseau en morceaux plus petits sans perte d'information, ou pour l'intégrer dans une autre structure plus facile à interpréter.

La théorie dans sa forme actuelle remonte au début des années 1980 et un groupe de recherche dirigé par Rudolf Wille, Bernhard Ganter et Peter Burmeister au Technische Universität Darmstadt. Ses définitions mathématiques de base, cependant, ont déjà été introduites dans les années 1930 par Garrett Birkhoff dans le cadre de la théorie générale du réseau. D'autres approches antérieures à la même idée sont nées de divers groupes de recherche français, mais le groupe de Darmstadt a normalisé le domaine et a systématiquement élaboré à la fois sa théorie mathématique et ses fondements philosophiques. Ces derniers font notamment référence à Charles S. Peirce, mais aussi à la Port-Royal Logic .

Motivation et contexte philosophique

Dans son article "Restructuring Lattice Theory" (1982), [1] initiant une analyse conceptuelle formelle en tant que discipline mathématique, Wille part d'un mécontentement avec la théorie actuelle du réseau et les mathématiques pures en général: la production de résultats théoriques - souvent obtenus par un "mental élaboré" gymnastique "- étaient impressionnants, mais les liens entre les domaines voisins, même certaines parties d'une théorie s'affaiblissaient.

Template:Quote

Cet objectif remonte à l'éducateur Hartmut von Hentig, qui en 1972 plaida pour une restructuration des sciences en vue d'un meilleur enseignement et afin de rendre les sciences mutuellement disponibles et plus généralement (c'est-à-dire également sans connaissances spécialisées) critiquables. [2] Par ses origines, l'analyse conceptuelle formelle vise donc l'interdisciplinarité et le contrôle démocratique de la recherche. <Réf name = "AttrExGeneRegProc"> Johannes Wollbold: Exploration d'attributs des processus de régulation des gènes . Thèse de doctorat,Université d'Iéna 2011, p. 9 </ref>

Il corrige le point de départ de la théorie du réseau lors du développement de la logique formelle au 19e siècle. Puis - et plus tard dans théorie des modèles - un concept comme unaire prédicat avait été réduit dans sa mesure. Encore une fois, la philosophie des concepts devrait devenir moins abstraite en considérant l'intention. Par conséquent, l'analyse conceptuelle formelle est orientée vers les catégories extension et intension de linguistique et la logique conceptuelle classique. [3]

L'analyse formelle des concepts vise à la clarté des concepts selon la maxime pragmatique de Charles S. Peirce en dépliant les propriétés élémentaires observables des objets subsumé. [4] Dans son philosophie tardive, Peirce a supposé que la pensée logique vise à percevoir la réalité, par le concept de triade, jugement et conclusion. Les mathématiques sont une abstraction de la logique, développent des modèles de réalités possible et peuvent donc soutenir une communication rationnelle. Sur ce fond, Wille définit:

Template:Quote

Exemple

Les données de l'exemple proviennent d'une étude sémantique sur le terrain, où différents types de étendues d'eau ont été systématiquement classés par leurs attributs. Cite error: Closing </ref> missing for <ref> tag un ensemble irréductible d'implications dont toutes les implications valides peuvent être dérivées par l'inférence naturelle ([[[ Axiomes d'Armstrong | Règles d'Armstrong]]). Ceci est utilisé dans l'exploration d'attributs , une méthode d'acquisition de connaissances basée sur les implications. [5]un ensemble incohérent d'implications dont toutes les implications valides peuvent être dérivées par l'inférence naturelle ( Règles d'Armstrong). Ceci est utilisé dans l'exploration d'attributs , une méthode d'acquisition de connaissances basée sur les implications. [5]un ensemble incohérent d'implications dont toutes les implications valides peuvent être dérivées par l'inférence naturelle ( Règles d'Armstrong). Ceci est utilisé dans l'exploration d'attributs , une méthode d'acquisition de connaissances basée sur les implications. [5]

Relations avec les flèches

L'analyse conceptuelle formelle a des fondements mathématiques élaborés, [3] rendant le champ polyvalent. Comme exemple de base, nous mentionnons les «relations fléchées», qui sont simples et faciles à calculer, mais très utiles. Ils sont définis comme suit: Pour g G et m M let

g m (g, m) I et si m'⊆n 'et' 'm' ≠ n ', alors (g, n) I ,

et en duel

g m (g, m) I et si g'⊆h 'et' 'g' ≠ h ', alors (h, m) I .

Étant donné que seules les paires objet-attribut non incidentes peuvent être liées, ces relations peuvent être facilement enregistrées dans le tableau représentant un contexte formel. De nombreuses propriétés de réseau peuvent être lues à partir des relations fléchées, y compris la distributivité et plusieurs de ses généralisations. Ils révèlent également des informations structurelles et peuvent être utilisés pour déterminer, par exemple, les relations de congruence du réseau.

Extensions de la théorie

  • 'Analyse conceptuelle triadique' remplace la relation d'incidence binaire entre objets et attributs par une relation ternaire entre objets, attributs et conditions. Une incidence (g, m, c) exprime alors que l'objet g a l'attribut m sous la condition c . Bien que les concepts triadiques puissent être définis par analogie avec les concepts formels ci-dessus, la théorie des trilattices qu'ils forment est beaucoup moins développée que celle des réseaux de concepts, et semble difficile. [6] Voutsadakis a étudié le cas n - [7]
  • 'Analyse de concept floue' : un travail approfondi a été effectué sur une version floue de l'analyse de concept formelle. [8]
  • 'Algèbres conceptuelles' : La modélisation de la négation des concepts formels est quelque peu problématique car le complément ( G \ A , M \ B ) d'un concept formel ( A , B ) n'est en général pas un concept. Cependant, comme le réseau de concepts est complet, on peut considérer la jointure ( A , B ) Δ de tous les concepts ( C , D ) qui satisfont C G \ A ; ou en double la rencontre ( A , B ) 𝛁 de tous les concepts satisfaisant D M \ B . Ces deux opérations sont respectivement appelées «négation faible» et «opposition faible». Cela peut être exprimé en termes d '«opérateurs de dérivation». Une négation faible peut être écrite comme ( A , B ) Δ = (( G \ A ) , ( G ' '\' 'A' ')'), et une faible opposition peut s'écrire ( A , B ) 𝛁 = (( M \ B ) ', (' 'M' '\' 'B' ')' '). Le réseau conceptuel équipé des deux opérations supplémentaires Δ et 𝛁 est connu sous le nom d '«algèbre conceptuelle» d'un contexte. Les algèbres conceptuelles généralisent l'ensemble de puissance s.La négation faible sur un réseau conceptuel L est une faible complémentation , c'est-à-dire une carte inversant l'ordre Δ: L L qui satisfait les axiomes x ΔΔ x et ( xy ) ⋁ ( xy Δ </ sup >) = x . Une composition faible est une double complémentation faible. Un réseau (borné) tel qu'une algèbre conceptuelle, qui est équipé d'une faible complémentation et d'une double complémentation faible, est appelé un «réseau faiblement décomplémenté». Les réseaux faiblement complémentés généralisent les réseaux orthocomplémentés distributifs, c'est-à-dire Algèbres booléennes. [9] [10]Problèmes linguistiques et informatiques | publisher = Springer | pages = 317–331 | isbn = 978-3-540-67859-5 | series = LNAI 1867}}. </ref> [10]Problèmes linguistiques et informatiques | publisher = Springer | pages = 317–331 | isbn = 978-3-540-67859-5 | series = LNAI 1867}}. </ref> [10]

Analyse du concept temporel (TCA)

L'analyse de concept temporel (TCA) est une extension de l'analyse de concept formelle (FCA) visant à une description conceptuelle des phénomènes temporels. Il fournit des animations dans des réseaux conceptuels obtenus à partir de données sur la modification d'objets. Il offre une manière générale de comprendre le changement d'objets concrets ou abstraits dans un espace et un temps continus, discrets ou hybrides. TCA applique une échelle conceptuelle aux bases de données temporelles. [11]

Dans le cas le plus simple, TCA considère les objets qui changent dans le temps comme une particule en physique, qui, à chaque fois, est exactement à un endroit. Cela se produit dans ces données temporelles où les attributs «objet temporel» et «temps» forment ensemble une clé de la base de données. Ensuite, l'état (d'un objet temporel à la fois dans une vue) est formalisé comme un certain concept d'objet du contexte formel décrivant la vue choisie. Dans ce cas simple, une visualisation typique d'un système temporel est un diagramme linéaire du concept de réseau de la vue dans lequel les trajectoires des objets temporels sont intégrées. [12]

TCA généralise le cas mentionné ci-dessus en considérant les bases de données temporelles avec une clé arbitraire. Cela conduit à la notion d'objets distribués qui se trouvent à un instant donné à de nombreux endroits, comme par exemple une zone de haute pression sur une carte météo. Les notions d '«objets temporels», de «temps» et de «lieu» sont représentées comme des concepts formels dans les échelles. Un état est formalisé comme un ensemble de concepts d'objets. Cela conduit à une interprétation conceptuelle des idées des particules et des ondes en physique. [13]

Algorithmes et outils

Il existe un certain nombre d'algorithmes simples et rapides pour générer des concepts formels et pour construire et naviguer sur des réseaux de concepts. Pour une étude, voir Kuznetsov et Obiedkov [14] ou le livre de Ganter et Obiedkov, [5] où l'on peut également trouver un pseudo-code. Étant donné que le nombre de concepts formels peut être exponentiel dans la taille du contexte formel, la complexité des algorithmes est généralement donnée par rapport à la taille de sortie.Les réseaux conceptuels avec quelques millions d'éléments peuvent être manipulés sans problème.

De nombreuses applications logicielles FCA sont disponibles aujourd'hui. [15] Le principal objectif de ces outils varie de la création de contexte formel au formel exploration de concepts et à la génération des concepts réseau d'un contexte formel donné et les implications correspondantes et règles d'association. La plupart de ces outils sont des applications open source académiques, telles que:

Techniques analytiques associées

Bicliques

Un contexte formel peut naturellement être interprété comme un graphe bipartite. Les concepts formels correspondent alors aux biclique maximales de ce graphe. Les résultats mathématiques et algorithmiques de l'analyse conceptuelle formelle peuvent ainsi être utilisés pour la théorie des bicliques maximales. La notion de dimension bipartite (du graphe bipartite complété) traduit [3] en celle de dimension Ferrers (du contexte formel) et de dimension d'ordre ( du concept treillis) et a des applications, par exemple pour la factorisation de la matrice booléenne. [21]

Biclustering et clustering multidimensionnel

Étant donné une table de données numériques à attribut d'objet, le but de biclustering est de regrouper certains objets ayant des valeurs similaires de certains attributs. Par exemple, dans les données d'expression génique, il est connu que les gènes (objets) peuvent partager un comportement commun pour un sous-ensemble de situations biologiques (attributs) uniquement: il faut donc produire des modèles locaux pour caractériser les processus biologiques, ces derniers devraient éventuellement se chevaucher, car un gène peut être impliqué dans plusieurs processus. La même remarque s'applique aux systèmes de recommandation où l'on s'intéresse aux modèles locaux caractérisant des groupes d'utilisateurs qui partagent fortement les mêmes goûts pour un sous-ensemble d'articles. Cite error: Closing </ref> missing for <ref> tag ne sont que des définitions d'un concept formel. [22]

Un bicluster de valeurs similaires dans une table de données numérique attribut d'objet est généralement défini [23] [24] [25] en tant que paire constituée d'un ensemble d'objets à inclusion maximale et d'un ensemble d'attributs à inclusion maximale ayant des valeurs similaires pour les objets. Une telle paire peut être représentée comme un rectangle à inclusion maximale dans le tableau numérique, les permutations de lignes et de colonnes modulo. Dans [22], il a été montré que les biclusters de valeurs similaires correspondent aux triconcepts d'un contexte triadique où la troisième dimension est donnée par une échelle qui représente les valeurs d'attribut numériques par des attributs binaires.Les modèles fermés rencontrent des relations n-aires "]. TKDD, 3 (1), 2009 </ref> en tant que paire composée d'un ensemble d'objets à inclusion maximale et d'un ensemble d'attributs à inclusion maximale ayant des valeurs similaires pour les objets. une paire peut être représentée comme un rectangle à inclusion maximale dans le tableau numérique, les permutations de lignes et de colonnes modulo. La dimension est donnée par une échelle qui représente les valeurs d'attributs numériques par des attributs binaires.Les modèles fermés rencontrent des relations n-aires "]. TKDD, 3 (1), 2009 </ref> en tant que paire composée d'un ensemble d'objets à inclusion maximale et d'un ensemble d'attributs à inclusion maximale ayant des valeurs similaires pour les objets. une paire peut être représentée comme un rectangle à inclusion maximale dans le tableau numérique, les permutations de lignes et de colonnes modulo. La dimension est donnée par une échelle qui représente les valeurs d'attributs numériques par des attributs binaires.Une telle paire peut être représentée comme un rectangle à inclusion maximale dans le tableau numérique, les permutations de lignes et de colonnes modulo. Dans [22], il a été montré que les biclusters de valeurs similaires correspondent aux triconcepts d'un contexte triadique où la troisième dimension est donnée par une échelle qui représente les valeurs d'attribut numériques par des attributs binaires.Une telle paire peut être représentée comme un rectangle à inclusion maximale dans le tableau numérique, les permutations de lignes et de colonnes modulo. Dans [22], il a été montré que les biclusters de valeurs similaires correspondent aux triconcepts d'un contexte triadique où la troisième dimension est donnée par une échelle qui représente les valeurs d'attribut numériques par des attributs binaires.

Ce fait peut être généralisé au cas dimensionnel n , où les grappes dimensionnelles n de valeurs similaires dans les données dimensionnelles n sont représentées par des concepts dimensionnels n + 1 . Cette réduction permet d’utiliser des définitions et des algorithmes standard d’analyse de concept multidimensionnelle [25] [7] pour calculer des clusters multidimensionnels.

Espaces de connaissances

Dans la théorie de l'espace des connaissances, on suppose que dans tout espace des connaissances, la famille des «états de la connaissance» est fermée par une union. Les compléments des états de connaissances forment donc un système de fermeture et peuvent être représentés comme les étendues d'un contexte formel.

Expérience pratique avec l'analyse de concept formelle

L'analyse conceptuelle formelle peut être utilisée comme méthode qualitative pour l'analyse des données. Depuis les débuts du FBA au début des années 1980, le groupe de recherche FBA de TU Darmstadt a acquis de l'expérience de plus de 200 projets utilisant le FBA (depuis 2005). Cite error: Closing </ref> missing for <ref> tag [26] génétique, [27] [28] écologie, [29] génie logiciel, [30] ontologie, [31] information et bibliothéconomie s, [32] [33] [34] administration du bureau, [35] loi, [36] [37] linguistique, [38] science politique. Cite error: Closing </ref> missing for <ref> tag Concept Lattices and their Applications (CLA), [39] ou Conférence internationale sur les structures conceptuelles (ICCS). [40]

Voir aussi

Template:Div col

Template:Div col end

Notes

Template:Reflist

Références

Template:Refbegin

Template:Refend

Liens externes


Catégorie: Machine learning Catégorie: Théorie du réseau Catégorie: Exploration de données Catégorie: Ontologie (science de l'information)


Cite error: <ref> tags exist, but no <references/> tag was found