Kollektive Intelligenz

Dieser Text ist Teil des Textes „Neustart der Menschlichkeit (Rebooting humanity)“

(Die Englische Version findet sich HIER)

Autor Nr. 1 (Gerd Doeben-Henisch)

Kontakt: cagent@cognitiveagent.org

(Start: 20.Juni 2024, Letzte Änderung: 25.Juni 2024)

Ausgangspunkt

Das Hauptthema dieses Abschnitts soll die ‚kollektive menschliche Intelligenz (KMI)‘ sein. Diese kommt jedoch nicht isoliert vor, nicht losgelöst von allem anderen. Vielmehr spannt das Leben auf dem Planet Erde ein komplexes Netzwerk von Prozessen auf, die — bei näherer Betrachtung — ‚in sich‘ Strukturen erkennen lassen, die für alle Lebensformen in ihren Eckwerten gleich sind, sich jedoch partiell unterscheiden. Dazu muss berücksichtigt werden, dass diese Grundstrukturen in ihrer Prozessform sich immer auch mit anderen Prozessen verweben, sie greifen ineinander, beeinflussen sich gegenseitig. Eine Beschreibung dieser Grund-Strukturen soll hier daher zunächst eher skizzenhaft sein, da man sich bei der ungeheuren Vielfalt der Details sonst zu schnell im ‚Dickicht des Besonderen‘ verirrt .

Wichtige Faktoren

Basiszyklus

Ausgehend von der einzelnen Zelle bis hin zu den mächtigsten Zellgalaxien [1], die das Leben bislang hervorgebracht hat, findet sich bei jeder identifizierbaren Lebensform ein ‚Grundschema‘ des Lebensprozesses, das sich wie ein ‚roter Faden‘ durch alle Lebensformen zieht: sofern es überhaupt mehr als ein einzelnes Lebenssystem gibt (eine ‚Population‘), gibt es während der gesamten Lebenszeit den Basiszyklus (i) Fortpflanzung Generation 1 – Geburt einer Generation 2- Wachstum der Generation 2 – Einsetzen von Verhalten der Generation 2 begleitet von Lernprozessen – Fortpflanzung der Generation 2 – ….

Genetische Determiniertheit

Dieser Basiszyklus ist in der Phase ‚Fortpflanzung‘ und ‚Geburt‘ weitgehend ‚genetisch determiniert‘ [2]. Der Wachstumsprozess selbst — der Aufbau der Zellgalaxie — ist grundsätzlich auch stark genetisch determiniert, aber hier nehmen zunehmend Faktoren Einfluss, die aus dem Umfeld des Wachstumsprozesses stammen und die unterschiedlich stark den Wachstumsprozess modifizieren können. Die Ergebnisse von Fortpflanzung und Wachstum können also schon mehr oder weniger stark variieren.

Lernen

In dem Maße, wie das Wachstum die Zellgalaxie in einen ‚ausgereiften‘ Zustand überführt hat, kann das Gesamtsystem unterschiedliche ‚Funktionen‘ ermöglichen, die zunehmend ein ‚Lernen‘ ermöglichen.

Ein Minimalbegriff von Lernen bezogen auf handelnde Systeme erkennt das ‚Lernen eines Systems‘ daran, dass das ‚Verhalten‘ eines Systems sich bezogen auf einen bestimmten Umgebungsreiz über längere Zeit ändert, und diese Veränderung ist ‚mehr als zufällig‘.[3]

‚Lernen‘ bewegt sich auf einer Skala von ‚relativ determiniert‘ bis hin zu ‚weitgehend offen‘. ‚Offen‘ heißt hier, dass die Kontrolle durch genetische Vorgaben abnehmen und das System innerhalb eines Spektrums von Handlungsmöglichkeiten individuell unterschiedliche Erfahrungen machen kann.

Erfahrungen

Erfahrungen gewinnen ihr ‚Format‘ innerhalb folgender Koordinaten:

(i) (sinnliche) Wahrnehmung (konkrete Ereignisse in unsren Sinnesorganen, ausgelöst durch Ereignisse der Umgebung)

(ii) Abstraktionen der sinnlichen Wahrnehmungen, die sich

(iii) (bedingt) abrufbar im Innern des Systems bilden (die Gesamtheit solcher bedingt abrufbaren (erinnerbaren) Wahrnehmungen nennt man auch Gedächtnisinhalte [4]), die Möglichkeit von

(iv) beliebigen Abstraktionen von vorhandenen Abstraktionen, das

(v) Abspeichern von zeitlichem Hintereinander von Abstraktionen genauso wie

(vi) Abstraktionen von ganzen Folgen von zeitlich aufeinander folgenden Ereignissen, sowie das

(vii) freie Kombinieren von beliebigen Abstraktionen zu neuen integrierten (abstrakten) Einheiten. Dazu kommt auch noch

(viii) die ‚Wahrnehmung körperinnerer Ereignisse‘ (auch ‚propriozeptive‘ Wahrnehmung genannt) [5], die sich mit allen anderen Wahrnehmungen und Abstraktionen ‚verknüpfen (assoziieren)‘ können [6]. Zu beachten ist auch, dass es eine Eigenschaft von Wahrnehmung ist, dass

(ix) Ereignisse in der Regel nie isoliert auftreten, sondern als ‚Teil einer Raumstruktur‘ erscheinen. Obwohl man ‚Teilräume unterscheiden kann (visuell, akustisch, taktil, …), lassen sich diese Teilräume zu einem ‚Gesamtraum‘ integrieren, der das Format eines ‚drei-dimensionalen Körperraums‘ hat, mit dem eigenen Körper als Teil. ‚In Gedanken‘ können wir zwar einzelne Objekte ‚für sich‘ betrachten, losgelöst von einem Körperraum, aber sobald wir uns dem ’sinnlichen Erfahrungsraum‘ zuwenden, wird die drei-dimensionale Raumstruktur aktiv.

Individuell – kollektiv

Im individuellen Durchleben von alltäglichen Situationen formiert sich diese ‚innere Erfahrungswelt‘ weitgehend unbewusst auf vielfältigste Weise.

Sobald aber ‚menschliche Systeme‘ — kurz: Menschen — in einer Situation nicht alleine sind, sondern zusammen mit anderen Menschen, können diese Menschen die gleiche Umgebung ‚ähnlich‘ oder ‚verschieden‘ wahrnehmen und erinnern. In ihren individuellen Erfahrungen können sich unterschiedliche Elemente zu bestimmten Mustern kombinieren.

Koordination von Verhalten

Spannend wird es, wenn verschiedene Menschen versuchen, ihr Verhalten zu koordinieren, und sei es nur, um ‚Kontakt‘ miteinander aufzunehmen. Und, obwohl dies auch ohne explizite symbolische Sprache in vielfältiger Weise möglich ist [7], gelingt ein anspruchsvolles, komplexes gemeinsames Handeln mit vielen Teilnehmer über längere Zeiträume mit anspruchsvollen Aufgabenstellungen nach heutigem Wissen nur unter Einbeziehung symbolischer Sprache.

Die Fähigkeit von Menschen, Sprachen zu benutzen, erscheint grundsätzlich genetisch bedingt zu sein. [8] ‚Wie‘ Sprache benutzt wird, ‚wann‘, ‚mit welchen Gedächtnisinhalten Sprache verknüpft‘ wird, dies ist genetisch nicht bedingt. Dies müssen Menschen jeweils ‚aus der jeweiligen Situation heraus‘ einerseits individuell lernen, zugleich aber auch kollektiv, in Abstimmung mit anderen, da Sprache ja nur Sinn macht als ein ‚gemeinsames Kommunikationsmittel‘, das anspruchsvolle Koordinierungen ermöglichen soll.

Sprachliche Bedeutung

Welches System von Lauten (und dann auch Zeichen) in eine Sprache zum Einsatz kommt entscheiden letztlich diejenigen, die erstmalig gemeinsam eine Sprache benutzen.[9] Da es faktisch viele tausend Sprachen gibt [10], kann man daraus schließen, dass es eine ziemliche Freiheit bei der konkreten Ausgestaltung einer Sprache gibt.[11]

Am stärksten zeigt sich diese ‚Freiheit in der konkreten Ausgestaltung‘ in der Zuordnung zwischen Sprachelementen und möglicher Bedeutung. Der gleiche ‚Gegenstand‘ oder das ‚gleiche Ereignis‘ oder der gleiche ‚Sachverhalt‘ kann von Menschen mit unterschiedlichen Sprache vollständig anders ‚ausgedrückt‘ werden.[12] Und dieses ‚anders‘ bezieht sich nicht nur auf die ‚Benennung‘ einzelner Eigenschaften oder Gegenstände, sondern spielt sich in einem ‚größeren Zusammenhang‘ von ‚Sehweisen‘ ab, wie in einer bestimmten Sprachgemeinschaft die Welt des Alltags als ganze wahrgenommen, klassifiziert und praktiziert wird. Diese Unterschiede treten auch ‚innerhalb einer Sprachgemeinschaft‘ auf in Form von ‚Milieus’/ ‚gesellschaftlichen Schichten‘, in denen sich die ‚Praxis des Lebens‘ unterscheiden.

Der wichtigste Aspekt des Verhältnisses von Sprachsystem (Laute, Zeichen, Anordnung von Lauten und Zeichen) zu möglichen ‚Bedeutungsinhalten‘ besteht darin, dass jede Art von ‚Inhalt‘ im ‚Innern‘ des Menschen ( im Innern des ‚Systems‘) zu verorten ist. [13]

Wie oben die kurze Skizze zum Erfahrungsraum anklingen lässt, so ist die Menge der Elemente, die einen Erfahrungsraum konstituieren können, so vielschichtig, so dynamisch, dass eine Zuordnung zwischen Sprachelementen und Erfahrungselementen — so die Arbeitshypothese — grundsätzlich unvollständig ist. Dazu kommt, dass sich zwei unterschiedliche Systeme (Menschen) nur dann über Erfahrungselemente als ’sprachliche Bedeutung‘ ‚einigen‘ können, wenn sie über ‚gemeinsame Bezugspunkte‘ in ihren individuellen Erfahrungsräumen verfügen. Dazu gibt es aufgrund der Systemstruktur nur folgende ‚Typen von Bezugspunkten‘:

(i) Es gibt sinnliche Wahrnehmungen von Gegebenheiten einer gemeinsam geteilten Umgebung, die bei allen Beteiligten ‚hinreichend‘ ähnlich wahrgenommen werden können (und im Erfahrungsraum automatisch (unbewusst!) in abstraktere Einheiten transformiert werden).

(ii) Es gibt interne Körperwahrnehmungen, die aufgrund einer genetisch bedingten Strukturähnlichkeit ’normalerweise‘ in jedem Menschen ähnlich auftreten können.[14]

(iii) Es gibt interne Wahrnehmungen von internen Prozessen, die aufgrund einer genetisch bedingten Strukturähnlichkeit die ebenfalls ’normalerweise‘ in jedem Menschen ähnlich auftreten können.[15]

Je ‚ähnlicher‘ solche internen Strukturen sind und je ‚konstanter‘ sie auftreten, umso größer ist die Wahrscheinlichkeit, dass sich unterschiedliche Sprachteilnehmer ‚interne Arbeitshypothesen‘ bilden können, was der jeweils ‚andere meint‘, wenn er bestimmte sprachliche Ausdrücke benutzt. Je mehr sich Erfahrungsinhalte von den Typen (i) – (iii) entfernen, um so schwieriger bis unmöglich wird eine Einigung.

Die Frage nach ‚wahren Aussagen‘ und nach ‚überprüfbaren Voraussagen‘ ist ein spezieller Teilkomplex des Bedeutungsproblems, der gesondert behandelt wird.

Komplexe Sprachformen

Erscheint schon die Bedeutungszuordnung und Bedeutungsfeststellung bei vergleichsweise ‚einfachen‘ sprachlichen Ausdrücken nicht ganz einfach, wird dies bei ‚komplexeren Sprachformen‘ schnell ‚verschwommen‘, ‚vage‘. Die Diskussionen und Forschungen zu diesem Themenkomplex sind unfassbar groß.[16]

Ich möchte hier nur kurz an das Beispiel von Ludwig Wittgenstein erinnern, der mit seinem Frühwerk ‚Tractatus logicop-philosophicus‘ (1921) zunächst das sehr schlichte Bedeutungskonzept der damaligen modernen formalen Logik ‚gedanklich experimentell‘ in einem Text durchgespielt hat, dann aber, viele Jahre später (1936 – 1946), das Problem der Bedeutung am Beispiel der Alltagssprache anhand vieler konkreter Beispiele neu durchexerzierte. Dabei entdeckte er — eigentlich kein Wunder — dass die ’normale Sprache‘ anders und erheblich komplexer funktioniert, als es in dem schlichten Bedeutungsmodell der formalen Logik vorausgesetzt wird.[17] Das, was Wittgenstein in seinen ‚alltagsnahen Analysen‘ entdeckt, war so vielschichtig-komplex, dass er sich außer Stande sah, dies in eine systematische Darstellung zu transformieren.[18]

Generell kann man sagen, dass es bis heute nicht einmal ansatzweise eine umfassende und zutreffende ‚Theorie der Bedeutung der normalen Sprache‘ gibt.[19]

Die Entstehung und Verbreitung von’generativer Intelligenz‘ in den letzten Jahren [20] kann hier möglicherweise eine unverhoffte Chance bieten, das Problem vielleicht ganz neu aufzurollen. Hier demonstriert die moderne Ingenieurkunst, dass einfache Algorithmen, die selbst über keinerlei eigenem Bedeutungswissen verfügen, nur unter Verwendung von Sprachmaterial [21] in sprachlicher Interaktion mit Menschen in der Lage sind, sprachlichen Output zu produzieren, der groß sein kann, strukturiert, und so angeordnet, dass Menschen diesen sprachlichen Output so auffassen, ‚als ob er von einem Menschen‘ stammt, was letztlich sogar stimmt. [22] Das, was ein Mensch an diesem sprachlichen Output bewundert, das ist dann letztlich ‚er selbst‘, allerdings nicht er in seinen individuellen Sprachleistungen, die häufig schlechter sind, als jene, die die Algorithmen generieren. Das, was dem individuellen Benutzer in solch generierten Texten begegnet, ist letztlich das ‚kollektive Sprachwissen‘ vieler Millionen von Menschen, das uns ohne diese Algorithmen (!) in dieser extrahierten Form gar nicht zugänglich wäre.

Diese generativen Algorithmen [23] kann man vergleichen mit der Erfindung des Mikroskops oder des Fernglases oder der modernen Mathematik: all diese Erfindung haben es dem Menschen ermöglicht, Sachverhalte, Strukturen zu erkennen, die ohne diese Instrumente unsichtbar geblieben wären. Das wahr Ausmaß kollektiver Sprachleistungen wäre ohne die moderne Technologie allein schon deshalb ‚unsichtbar‘, weil Menschen ohne diese Technologien den Umfang und das Ausmaß samt allen Details gar nicht erfassen könnten.

Vorläufiges Zwischenergebnis

Die bisherigen Überlegungen lassen nur in ersten Umrissen erkennen, was kollektive Intelligenz sein kann bzw. ist.

[1] Erinnerung: Wenn wir für die Anzahl der Sterne in unserer Heimatgalaxie der Milchstraße mit geschätzten 100 – 400 Milliarden Sterne mal annehmen, dass es 200 Milliarden sind, dann würde unser Körpersystem dem Umfang von 700 Galaxien im Format der Milchstraße entsprechen, eine Zelle für einen Stern. … ein einzelner Körper !

[2] Wobei wir heute wissen, dass Gene sich in verschiedenen Phase auf unterschiedliche Weise ändern können bzw. verändert werden.

[3] Vereinfachend kann man sagen, dass ‚Zufälligkeit‘ in einer ‚verteilungsfreien Form‘ besagt, dass jede der bekannten möglichen Fortsetzungen ‚gleich wahrscheinlich‘ ist; keine der möglichen Fortsetzungen weist im Laufe der Zeit eine ‚höhere Häufigkeit‘ auf als eine der anderen. Eine Zufälligkeit mit einer ‚impliziten Verteilung‘ fällt dadurch auf, dass zwar die möglichen Fortsetzungen auch zufällig sind, aber bestimmte Fortsetzungen zeigen im Laufe der Zeit eine andere Häufigkeit als andere. Alle diese besonderen individuellen Häufigkeit zusammen lassen ein ‚Muster‘ erkennen, anhand dessen man sie charakterisieren kann. Ein Beispiel für eine ‚Zufälligkeit mit Verteilung‘ ist die ’natürliche (oder Gauss-) Verteilung‘.

[4] Der Begriff des ‚Gedächtnisses‘ ist ein theoretisches Konzept, dessen empirische und funktionale Beschreibung bis heute nicht ganz abgeschlossen ist. In der Literatur unterscheidet man z.B. viele verschiedene ‚Formen von Gedächtnis‘ wie ‚Kurzzeitgedächtnis‘, ‚Langzeitgedächtnis‘, ’sensorisches Gedächtnis‘, ‚episodisches Gedächtnis‘, und vieles mehr.

[5] Z.B. ‚Stellung der Gelenke‘, ‚Schmerzen‘, ‚Völlegefühl‘, ‚Unwohlsein‘, ‚Hunger‘, ‚Durst‘, verschiedene ‚Emotionen‘ usw.

[6] Man sieht dann eben nicht nur einfach einen ‚blauen Himmel‘ und empfindet gleichzeitig eine ‚leichten Brise auf der Haut‘, sondern man hat zugleich ein Gefühl des ‚Unwohlseins‘, von ‚Fieber‘, vielleicht sogar noch ein ‚Gefühl von Niedergeschlagenheit‘ und Ähnlichem.

[7] In der biologischen Verhaltensforschung gibt es zahllose Beispiel von Lebensformen, die beeindruckende Koordinationsleistungen zeigen, wie z.B. beim gemeinsamen Jagen, bei der Organisation für die Aufzucht der Nachkommen, im ‚Familienverband‘, beim Erlernen der ‚Dialekte‘ ihrer jeweiligen Sprache, beim Hantieren mit Werkzeugen, …

[8] Jedes Kind kann überall jede bekannte menschliche Sprache lernen, sofern es eine Umgebung gibt, in der eine Sprache praktiziert wird. Bekannt sind viele tausend verschiedene Sprachen.

[9] Der genaue Mechanismus, wie eine Sprache erstmalig zwischen einer Gruppe von Menschen entsteht, ist bis heute nicht vollständig geklärt. Es gibt allerdings immer mehr Computer-Simulationen zum Sprache lernen (Sprachevolution), die versuchen, dies zu erhellen. Aufgrund der ungeheuren Vielzahl der beteiligten Faktoren beim realen Sprachgebrauch erscheinen diese Simulationen aber noch ‚eher einfach‘.

[10] Wie wir anhand vieler Zeugnisse wissen, gab es in vorausgehenden Zeiten viele andere Sprachen, die irgendwann ausgestorben sind (‚tote Sprachen‘), und von denen dann nur schriftliche Zeugnisse existieren. Interessant sind auch solche Fälle, in denen sich eine Sprache ‚weiter entwickelt‘ hat, wo dann ältere Formen aber als Texte weiter existieren.

[11] Die Sprachforschung (viele unterschiedliche Disziplinen wirken hier zusammen) legt aber die Arbeitshypothesen nahe, dass (i) die Art und der Umfang der Laute, die in einer Sprache zum Einsatz kommen, aufgrund des menschlichen Sprachapparats eine endliche Menge darstellen, die sich mehr oder wenig ähnlich in allen Sprachen wiederfinden, wenngleich zwischen den großen Sprachfamilien dann doch noch unterschiedliche Mengen an Lauten auftreten. Ferner (ii) legen viele Analysen der Struktur gesprochener und dann der geschriebenen — Sprache nahe, dass es ‚Grundstrukturen‘ (‚Syntax‘) gibt, die sich — mit Variationen — in allen Sprachen finden.

[12] Jeder, der mit Menschen zusammen kommt, die eine andere Sprache sprechen, kann dies hautnah und konkret erleben.

[13] Im Lichte der modernen Gehirnforschung und allgemeiner Physiologie wird man hier als ‚Ort‘ das Gehirn annehmen. Diese Verortung nützt allerdings nicht all zuviel, da die Erforschung des materiellen Gehirns im Körper mitsamt seinen Interaktionen mit dem umgebenden Körper bis heute kaum in der Lage ist, die genauen Mechanismen von ‚Bedeutungszuordnungen‘ zu erfassen (genauso wenig wie man aufgrund von physikalischen Signalen der Chips eines Computers allein aufgrund von diesen Signalen denjenigen Algorithmus identifizieren zu können, dessen Ausführung die beobachtbaren Signale verursacht).

[14] z.B. ‚Hunger‘, ‚Durst‘, ‚Zahnschmerzen‘ …

[15] Das ‚Erinnern‘ von etwas, was schon mal passiert ist; das ‚Wiedererkennen‘ von etwas sinnlich Konkretem, was man ‚erinnern‘ kann; das ‚Kombinieren‘ von Erinnerbarem zu neuen ‚Konstellationen‘, und vieles mehr.

[16] Teile dieser Diskussion finden sich im Kontext von ‚Textanalysen‘, ‚Textinterpretationen‘, ‚Hermeneutik‘, ‚Bibelauslegung‘ usw.

[17] Was wiederum überhaupt nicht verwundert, da die moderne formalen Logik ja gerade nur entstehen könnte, weil man sich ‚programmatisch radikal‘ von dem, was alltags-sprachlich mit Bedeutung zu tun hat, verabschiedet hatte. Übrig geblieben waren nur ‚Stummel einer abstrakten Wahrheit‘ in Form von abstrakten ‚Wahrheitswerten‘, die jeder Bedeutung beraubt waren.

[18] Seine posthum heraus gegebenen ‚Philosophical Investigations‘ (1953) bieten daher ’nur‘ eine Sammlung von Einzelerkenntnissen, die aber immerhin das Zeug hatten, die Reflexionen über sprachliche Bedeutung weltweit zu beeinflussen.

[19] Die Liste von Publikationen, in denen es laut Titel um die ‚Bedeutung von Sprache‘ geht, ist überaus lang. Dies ändert aber nichts an der Tatsache, dass keine dieser Publikationen das Problem in umfassender Sicht zufriedenstellend löst. Es ist aktuell auch nicht absehbar, wie eine Lösung entstehen kann, da dies das Zusammenwirken von vielen Disziplinen verlangen würde, die im aktuellen Hochschulbetrieb gut verteilt und getrennt ein ‚Eigendasein‘ führen.

[20] Mit chatGPT als einem Beispiel.

[21] Viele Millionen von Texten, die Menschen für die Zwecke der ‚Kommunikation von Inhalten‘ produziert haben.

[22] Was letztlich ja sogar stimmt, weil die Algorithmen selbst keinen Text ‚erfinden‘, sondern nur anhand vorhandener Texte ‚tatsächlich benutzte‘ sprachliche Ausdrücke benutzen, um damit ‚hoch wahrscheinliche‘ Kombinationen von Ausdrücken zu generieren, die Menschen wahrscheinlich verwenden würden.

[23] Die man nicht isoliert sehen darf: ohne extrem leistungsfähige Rechenzentren samt entsprechenden globalen Netzen samt gesellschaftlichen Strukturen, die eine flächendeckende Nutzung möglich machen, wären diese Algorithmen wertlos. Hier leuchtet indirekt auch das auf, was nur aufgrund der kollektiven menschlichen Intelligenz möglich wurde und im Alltag funktioniert.