Sunday, October 31, 2010

Dynamisch Vs. Statisch - Der Krieg der Urgewalten

Dieser Artikel beschäftigt sich mit einem der ältesten Themen der Softwareentwicklung - und einen in dem es die heftigsten Grabenkämpfe gibt: Statische Typprüfung oder doch lieber dynamische Typisierung?

Ziel soll ein Vergleich zwischen den Unterschieden der Systeme sein, nicht der Sprachen und ihrer Features.

Dynamisch typisiert ist nicht gleich dynamisch typisiert, man vergleiche nur PHP, Phyton und Clojure.... Bei den statischen Typsystemen fallen die Unterschiede sogar noch viel größer aus, weil diese viel mehr theoretische Substanz und ein viel aufwendigeres Design für das Typsystem und seine Einbindung enthalten müssen.

Dazu auch gleich der erste Punkt:
Viel Blame an den statischen Typsystemen ist meist eher Blame an einzelnen Sprachen und deren schlechter Umsetzung desselben.

Im Falle Java hat die Unzufriedenheit mit der Sprache soweit geführt, dass die dynamischen Sprachen sogar bei Entwicklern beliebter geworden sind, die früher vllt. statische Typsysteme favorisiert haben. Einer der Hauptgründe für die Unbeliebtheit vieler statischer Sprachen dürfte die fehlende Typinferenz sein, d.h dem Zwang an allen Variablen auch immer die Typen mitanzugeben.

Dies ist jedoch eigentlich nur eine Designschwäche:
Statische Sprachen wie Scala, OCaml oder Haskell, aber auch C# kommen an vielen Fällen ohne Typannotationen aus und verwenden kurze Schlüsselwörter, z.B. var oder let, zur Variablendefinition, ohne Angabe des Typs. Der Code ähnelt dann dem von dynamischen Sprachen und ist ähnlich kurz. Mehr zum Thema Typinferenz in einem späteren Artikel...

Einer der häufig genannten Sellingpoints statischer Sprachen ist nach der Meinung ihrer Evangelisten die Performance, die höhere Sicherheit zur Laufzeit und die bessere Dokumentation des Codes. Außerdem sieht man durch die Typannotationen besser was passiert. Alle diese Punkte sind valide, allerdings zu recht für viele Freunde dynamischer Sprachen nicht stichhaltig genug:
  • Performance ist relativ: Man hat bei dynamischen Sprachen zwangsläufig höhere Kosten durch den dynamischen Dispatch aller Methodenaufrufe. Es gibt hier aber Fortschritte, durch die diese Kosten in einen marginalen Bereich zurückgedrängt werden können. Auch dynamische Sprachen können z.T. den schnelleren statischen Dispatch einsetzen, wenn der Compiler in der Lage ist, die Datentypen aus dem Kontext heraus zu identifizieren(=> Typinferenz). Einige Sprachen, z.B. Clojure, bieten auch die Möglichkeit, Typen explizit zu annotieren und auf diese Art und Weise an Schlüsselstellen statische Performance zu bieten.
  • Typsicherheit: Setzt voraus, dass das Typsystem so umfassend ist dass es möglich ist, damit typsicher zu arbeiten. Das ist aber selten der Fall, eigentlich ist es nur in so mächtigen Typsystemen wie dem von Haskell wirklich möglich. Merke: Jeder Typecast öffnet genau die Lücke, die statische Sprachen eigentlich schließen wollen. Ergo ist Code mit vielen Typecasts ein klarer Sellingpoint für dynamische Sprachen - oder Sprahcen mit besseren Typsystemen. Einen wirklichen Verzicht auf Typecasts wird man wohl nur mit strukturellen Typsystemen erreichen (halt Haskell oder Scala).
  • Bessere Codedokumentation durch Typannotationen: Korrekt. Allerdings sollte die Sprache Typannotationen nur bei Methoden für vorraussetzen, weil nur dort wirklich wichtig ist, welche Typen erwartet werden.
  • Einfacheres Refactoring / Bessere Toolunterstützung: Finde ich sehr wichtig. Statische Sprachen haben es leichter, dem Entwickler Vorschläge zu machen, welche Methoden er aufrufen kann etc. Bei dynamischen Sprachen fehlt oft diese Hilfestellung, weil er Compiler selbst nie alle Funktionen kennen kann, die aufrufbar sind. Dennoch wird es auch hier Fortschritte geben, so dass dieses Argument nur bedingt tauglich ist.
Evangelisten dynamischer Sprachen können außerdem auf klare Vorteile ihres Ansatzes hinweisen:
  • Fehler bei der Typisierung sind eher selten und gehören meist nicht zu den Showstoppern. Korrekt. Wäre dies so, dann gäbe es ja gar keine dynamischen Sprachen. Außerdem bedeutet statische Typsicherheit ja nicht, dass der Code das macht was er soll, sondern nur dass alle Methoden und Typen richtig aufgelöst werden können.
  • Wirklich sicheren Code erreicht man durch Unittests. Auch korrekt, aber man muss theoretisch auch viel mehr testen - nämlich auch dass die Typ-Constraints erfüllt werden. In der Praxis wird man dieses aber nur selten tun. Dennoch: Bei Test-First-Ansätzen ist der Vorteil der Typsicherheit statischer Sprachen zu vernachlässigen, weil der Code hier nur Mittel für einen gesetzen Zweck ist.
  • Keine Typannotationen - Ist wie oben gesagt eine Schwäche vieler statischer Sprachen, aber nicht der statischen Typisierung an sich.
  • Duck-Typing ermöglicht es, Code mit wenig Redundanzen zu schreiben. Der Code legt den Fokus stärker auf Prozesse und Schnittstellen und weniger auf Typhierarchien. Finde ich valide, allerdings ermöglichen strukturelle Typsysteme fast dasselbe. Man muss aber fairerweise sagen, dass man auch nicht alle Spielarten der dynamischen Typisierung durch ein strukturelles Typsystem abbilden kann.

Zwischenstand

Statisch
  • Je stärker das Typsystem, desto mehr machen sich die Vorteile einer statischen Sprache bezahlt. Inbesondere dann wenn nur Single-Dispatch angeboten wird (d.h.: Dispatch auf der Basis von Typen => Vererbung) ist statische Typisierung sehr gut implementierbar.
  • Typinferenz und strukturelle Typsierung sind die Schlüsseleigenschaften zu einfachem Code
  • Objektorientierung und nominelle Typisierung sind nützlich, aber nicht unbedingt erforderlich. Falls aber OO verwendet wird, ist eine klare Objekthierarchie und der Ansatz Everything Is An Object das A und O zur einfacher Verwendung. Nicht nur C++ ist hier ein Gegenbeispiel, sondern auch Java mit seinen Primitiven und der  z.T. etwas eigenwilligen Vererbungshierarchie im JDK.
  • Casts sind der Feind der statischen Typisierung! Wenn häufig Casts nötig werden, oder der Programmierer sie für nötig hält, dann sollte er besser zu einer dynamischen Sprache wechseln. Die Vorteile der statischen Typisierung sind dann nämlich dahin. 
  • Besserer IDE-Support durch das Typsystem möglich
  • Es kann eine bessere Performance erreicht werden
Dynamisch
  • Das Typsystem und seine Struktur treten in den Hintergrund. Der Programmierer kann sich auf Operationen konzentrieren und muss weniger über Typsysteme wissen.
  • Automatische Typkonvertierungen (Koercions) sind in dynamischen Systemen extrem gefährlich. Aufgrund der großzügigeren Typprüfung kann der Code schnell nicht mehr nachvollziehbar werden, wenn zusätzlich noch implizite Konvertierungen vorgenommen werden. Mit einer starken Typisierung ist ein dynamisches Typsystem aber relativ leicht beherrschbar, wie z.B. in Phyton. Gegenbeispiele sind PHP und Javascript.
  • Lispartige Sprachen, d.h. Sprachen die in ihrer eigenen Syntax entwickelt sind, sind fast zwangsläufig von dynamischer Natur. Will man also eine Homophone Sprache verwenden, wird man aus Gründen der Einfachheit immer dynamisch typisieren wollen (Clojure).
  • Der Aufwand für Unittests ist durch die fehlende Sicherheit höher, ebenso die Unterstützung durch IDEs geringer. Der Vorteil, sich stärker auf die Prozesse konzentrieren zu können, ist aber sehr groß.
  • Die Sprache wird einfacher durch die geringe Bedeutung des Typsystems. Flexiblere Ausdrücke sind möglich. Das ermöglicht eine leichtere Implementation und ein schnelleres Verständnis der Sprache. Man vergleiche nur den Umfang eines Clojure-Lernbuchs mit einem Java- oder Scala-Buch...
  • Meiner Meinung nach können nur dynamische Sprachen sinnvollen "Multi-Dispatch" in der Form von Multimethods anbieten.
Und nun? Grundsätzlich kann man es fairerweise so zusammenfassen: Eigentlich gibt es kein schlechter und kein besser. (Ja, ich weiß... laaaangweilige Antwort).

Programmierer, die gut im Kategorisieren und Definieren von Wertmengen sind, werden ihre Produktivität mit statischen Sprachen besser entfalten können. Wenn man eine "perfekte" Lösung erstellt hat, ist meist die Motivation zu Tests geringer - eine wohltypsierte Lösung möchte man wahrscheinlich kaum durch redundante Tests noch mal "beweisen". Da kommt es sicher entgegen, dass die statischen Typsysteme einem diese Aufgabe zu einem gewissen Teil bereits abnehmen.

Programmier, die hingegen prozessorientiert Denken mögen gegenteilige Erfahrungen gemacht haben: Gerade der Ansatz "Test First" ist dann am effektivsten, wenn man mit dynamischen Sprachen arbeitet: Hier werden zuerst die Tests, also die Validierungsroutinen entwickelt und darauf aufbauend eine möglichst einfache Implementation erzeugt, die passt. Sowohl die Definition als auch die Durchführung dieses Vorgangs ist mit dynamischen Sprachen und ihrer stärker auf Ergebnisse ausgelegten "Denkweise" besser möglich. Dafür sind die Ausdrücke dann meist weniger gut in statischen Typsystemen ausdrückbar. Es funktioniert oder es funktioniert nicht - warum ist für das Erreichen eines Ergebnisses ja eigentlich nicht so wichtig.

Ich persönliche tendiere eher zu ersten Sichtweise, halte die zweite aber auch für sehr sinnvoll, und in der Praxis auch leichter anwendbar. Was meiner Meinung nach für beide Sichtweisen gilt ist: Die Sprache muss gut sein.
Das gilt vor allem für die statischen Sprachen! Java, C/C++, ... , alle sind unnötig kompliziert, haben unzureichende Typsysteme mit seltsamen Sonderlocken für Arrays und Strings etc. Da lohnt sich auch für Analytiker meist kaum der Einarbeitungsaufwand. Zum Teil gibt es noch nicht mal die Möglichkeit, Closures zu definieren. Außerdem fehlt vor allem Java und C++ immer noch die Typinferenz, so dass der Code sehr aufwendig zu erstellen und zu pflegen ist.
Vor dem Hintergrund wäre man eigentlich verrückt, die geringen Vorteile einer solchen statischen Sprache den eindeutigen einer dynamischen vorzuziehen. Diese sind nämlich schon allein von ihrem Naturell her einfacher zu entwickeln, da das Typsystem ja egal ist. Abgesehen von hässlichen Kröten wie PHP ist man deshalb auch in der Lage, mit den meisten Sprachen recht ähnliche Ergebnisse zu erreichen und ähnlich zu entwickeln.
Dennoch sehe ich auch in diesem Lager Unterschiede. Insbesondere wundert mich, das viele dynamische Sprachen dennoch objektorientiert sind. Grundsätzlich ist OO ok, aber sie ist im Rahmen von statischen Typsystemen viel nützlicher als in den dynamischeren Umgebungen, denke ich. Dynamische Sprachen sollten sich stärker auf Funktionen als Typen und Klassen konzentrieren!

Meine vollkommen subjektive Meinung
  • Wenn statisch, dann etwas in der Richtung von Scala oder Haskell ("echtes Typsystem", strukturell, Typinferenz). Gerne auch objektorientiert.
  • Wenn dynamisch, dann kann man den Vorteil der Homophonie nutzen: Die Sprache ist in ihrer eigenen Syntax entworfen. Aufbauend auf einer geringen Syntax werden alle Kontrollstrukturen und alle Konstrukte wie z.B. Funktionen ausgedrück, Da bietet sich natürlich die Lisp-Familie mit Clojure an..
  • Ein weiterer sehr starker Contender für dynamische Sprachen ist hier durch seine Ausgereiftheit und sein solides Wachstum Python. Warum? Weil es einfach eine schöne Sprache ist. ;-)

    Polymorphie - Die Vielformigkeit der Vielformigkeit


    Polymorphie("Viele Formen") bedeutet in der Programmierung, dass ein Bezeichner abhängig vom Kontext unterschiedliche Bedeutungen hat. In Typsystemen ist Polymorphie ein sehr wichtiges Konzept um abstrakte Datentypen zu definieren (z.B. die Klassen der Objektorientierung). Nur extrem wenige Sprachen verwenden keinerlei dynamische Polymorphie - und diejenigen, die auf diese Kerneigenschaft verzichten, sind normalerweise.. scheiße. Beispiel: C hat war keine einzige Möglichkeit, durch dynamische Polymorphie Abstraktionen auszudrücken.

    Der Polymorphismus hat ironischerweise selbst auch "viele Formen" und lässt sich in verschiedene Unterkategorien aufteilen. Interessanterweise können sich diese Unterkategorien zum Teil auch ordentlich in die Quere kommen. So sind z.B. das statische Method-Overloading und Vererbung zum Teil inkompatibel. Ich werde im folgenden nicht weiter darauf eingehen, aber vllt. dann mal wenn ich Kovarianz und Kontravarianz im Zusammenhang mit Typparametern (a.k.a. Generics) erkläre.

    1. Ad-Hoc-Polymorphimus (Polymorphismus zur Compilezeit)
    Polymorphimus zur Compilezeit bedeutet, das ad-hoc im Code Polymorphismus eingesetzt wird, um Bezeichner mit Bedeutungen zu überladen, dies aber nicht dynamisch geschieht, sondern durch den Compiler geprüft werden kann.
    • Method Overloading: Eine der bekanntesten Möglichkeiten ist sicherlich die Methodenüberladung. Abhängig von der Parameterliste wird je nach Aufruf eine andere Methode aufgerufen. Dies geschieht aber nicht zur Laufzeit sondern anhand der zur Compilezeit bekannten Typen. Besonders populär in Java, C++, C#.
    • Operator Overloading: Eigentlich nur ein Sonderfall des Method Overloadings. In Sprachen, die es erlauben Operatoren zu überladen, sind Operatoren nämlich eigentlich nur Funktionen, die Symbole wie "+" im Namen verwenden können. Ok, ... außerdem muss noch eine andere Schreibweise für Funktionsaufrufe erlaubt werden: Die Infix-Notation, bei der Parameter Methode Parameter geschrieben wird statt der Präfix-Notation Methode Parameter Parameter
    • Typparameter: Ebenfalls ein Sonderfall des Polymorphimus. Durch Typparameter kann ein Typ, z.B. eine Liste, ad-hoc zur Compilezeit in eine spezialisierte Liste, z.B. für Strings, verwandelt werden. Derselbe Bezeichner "Liste" kann hier so überladen werden, dass er sich im einzelnen Anwendungsfall auf einen oder mehrere bestimmte Typen spezialisiert. Diese werden durch die Typparameter definert. Typparameter sind ein must-have für alle sicheren statischen Typsysteme. (Siehe auch mein anderer Artikel zu Collections.)
    • Implizite Konvertierungen (Type Coercions): Ebenfalls zur Ad-Hoc Polymorphie zählen die impliziten Konvertierungen, wie sie z.B. in vielen Sprachen für numerische Typen gang und gäbe sind. Die Konvertierung ermöglicht es z.B. einen Integer so zu benutzen, als wäre er ein Long-Wert: In noch extremeren Fällen kann es sogar erlaubt sein, einen Integer wie einen String zu benutzen... Auch hier wird also ein Bezeichner mehrfach verwendbar, weil er automatisch in eine passende Rolle "gezwungen" (coerct) wird. Dies ist die einzige Art der Polymorphie, die C beherrscht - und gleichzeitig auch eine sehr fragwürdige, weil sie das Typsystem unsicherer (weak) macht. Typkonvertierungen sind im Allgemeinen Bestandteil der Sprache - es kann aber auch erlaubt sein, dass der Programmierer diese selbst definiert, wie es z.B. in Scala möglich ist.

      2. Dynamischer Polymorphimus (Polymorphismus zur Laufzeit)
      Der dynamische Polymorphismus erlaubt es, erst zur Laufzeit anhand des manifestierten Typs zu entscheiden, was zu tun ist. Insgesamt sind zwei unterschiedliche Strategien bekannt, die als single-dispatch und multi-dispatch bezeichnet werden:
      • Single-Dispatch anhand des Typs (Vererbung, Typklassen)
      Single-Dispatch anhand des Typs ist die verbreitetere Variante. Hierbei ist es möglich, anhand eines abstrakten Typs zu entscheiden, was zu tun ist. Die meisten kennen dies aus der Objektorientierung: Wenn ich auf einer Variablen vom Typ "Set" eine "add"-Methode aufrufe, wird nicht die "add"-Methode von List aufgerufen, sondern von der konkreten Klasse, zu der Wert der Variable gehört. Das kann z:B. ein HashSet oder ein TreeSet sein. Es ist also möglich, durch Abstraktion die Entscheidung auf einen Untertyp zu vertagen, was eigentlich zu ist. Zusätzlich erlaubt es das Konzept der Vererbung, für einige Methoden bereits eine (Default)-Implementierung vorzugeben.
      Auch andere Sprachen, die keine Objektorientierung verwenden, kennen den Single-Dispatch: Haskell verwendet mit seinen Typklassen ein Konzept, das genau das gleiche macht, jedoch auf die starre Objekthierarchie verzichtet. Schaut euch dazu am besten meinen Artikel zu strukturellen Typsystemen an.
      • Multi-Dispatch anhand der Paramaterliste (Multi-Methods)
      Multi-Dispatch ist ein sehr seltenes Phänonem, das eigentlich ausschließlich in dynamischen Sprachen angeboten wird. Da statische Typsysteme sehr stark an Typen und ihren Beziehungen interessiert ist, wird dort traditionell eher der Single-Dispatch verwendet.
      Multi-Dispatch bedeutet dass ich eine Methode zur Laufzeit überladen kann. Dies ist dem Method-Overloading ähnlich, aber flexibler. Wenn ich z.B. eine Multi-Method habe, die drei Parameter entgegen nimmt, dann kann ich dynamisch zur Laufzeit neue Handler definieren, die für eine andere Kombination von Parametertypen gelten. Sobald die Methode mit Werten aufgerufen wird wird dann anhand der Eingangsdatentypen (Klassen) die richtige Methode ausgewählt.
      Das Konstrukt ist deutlich mächtiger als die statische Methodenüberladung und macht primär in dynamischen Sprachen Sinn, die keine Objektorientierung oder Vererbung verwenden (z.B. Clojure).
       
      • Single-Dispatch vs MultiDispatch
      Es ist für eine Sprache sehr unüblich, sowohl single- als auch multidispatch anzubieten, weil beide eine vollkommen andere Herangehensweise haben:
        • Single-Dispatch macht in Systemen Sinn bei denen Typen im Vordergrund stehen, und Abstraktionen anhand der Typschnittstellen realisiert werden. Beispiele: Alle OO-Sprachen, aber auch Haskell.
        • Multi-Dispatch eigent sich für Sprachen, bei denen Operationen im Vordergrund stehen und nicht die Typen. Konsequenterweise wird hier meist auf OO verzichtet und dynamisch typisiert. Beispiele: Lisp-Dialekte, vor allem Clojure.
      Ich werde in meinen Artikel primär den Single-Dispatch betrachten, weil er verbreiteter ist, und ich mich hauptsächlich mit statischen Typsystemen befasse. Für dynamische Sprachen ist Multi-Dispatch oft aber sicher eine bessere Alternative - mir fehlt hierzu nur leider das Wissen und die Praxis.
      • Performance und dynamischer Dispatch
      Das Wort Laufzeit impliziert übrigens auch Kosten: Der dynamische Dispatch ist immer aufwändiger als eine statische Verlinkung von Methoden.
      Bei der Objektorientierung muss z.B. vor jedem virtuellen Methodenaufruf in einer Virtual Method Table nachgeschaut werden, welche Methode denn aufzurufen ist. Diese Kosten können moderne Compiler zu großen Teilen negieren, aber nicht vollständig elimieren. Am effektivsten sind sicherlich Virtual Machines wie die JVM: Diese können zur Laufzeit sicherstellen dass auch wirklich nur die Methoden dynamisch sind, die auch überschrieben werden. In allen anderen Fällen kann die VM den Aufruf zum schnelleren statischem Dispatch optimieren.
      Ad-Hoc-Polymorphismen haben diesen Nachteil nicht: Im Gegenteil können Konstrukte wie Typparameter sogar enorme Performanceverbesserungen bedeuten, da der Compiler den Code mit den präziseren Informationen optimieren kann (aber nicht muss, siehe: Java).


      3. Bewertung der unterschiedlichen Ausprägungen der Polymorphie
      Allgemein kann man sagen, dass Polymorphie gerade für statisch typisierte Sprachen entscheidend sind, um den Code einfacher und generischer zu gestalten. Die wichtigsten Polymorphismen sind definitiv die Typparameter und der dynamische Single-Dispatch.
      Das statische Überladen von Methoden / Operatoren und die impliziten Konvertierungen werden hingegen wohl immer Streitthemen bleiben. Ich würde aber sagen, dass alle ihren Nutzen haben:

      Operatorenüberladung: Alle Sprachen, die Operatoren anbieten, sollten diese auch überladbar machen. Es gibt nichts nervigeres, als wenn die Sprachdesigner meinen, sie wären besser als der Programmierer und dürften Dinge, die er nicht darf. Meist führt dies eher zu schlechterem Code als dies andersherum wäre, weil die eingebauten primitiven Typen dann in Anwendungsfällen vorgezogen werden, in denen man eigentlich selbst passendere Typen definieren sollte.

      Methodenüberladung: Wenn man Operatorenüberladung anbietet sollte man Methodenüberladung im Allgemeinen anbieten. Die Operatorenüberladung ist nämlich eigentlich nur ein Sonderfall der Methodenüberladung.

      Implizite Konvertierungen: Das Streitthema. Implizite Konvertierungen werden meist als unnütz und gefährlich erachtet, und von Freunden der statischen Typisierung als ein Feature von Skriptsprachen verlacht. Das hat eine gewisse Ironie: Tatsächlich bieten meist dynamische "Sprachen" wie PHP exzessive Typumwandlungen an, obwohl diese es gar nicht nötig hätten: Das Duck-Typing macht das Umwandeln von Typen, das man ja primär macht, um Schnittstellen zu erfüllen, nur selten nötig!
      Gerade in objektorientierten Sprachen wären selbstdefinierte implizite Konvertierungen aber sehr nützlich, da hier meist identische Konzepte in unterschiedlichen Objekthierarchien verwendet werden - und die einzige Möglichkeit zum gemeinsamen Verwenden der Hierarchien explizite Typumwandlungen durch Wrapper sind. Implizite Konvertierungen könnten es hier aber ermöglichen, unterschiedliche Hierarchien seamless miteinander zu verbinden!
      Leider ist die einzige Sprache, die bisher diese Möglichkeit bietet, Scala. In allen anderen Sprachen sind die impliziten Konvertierungen schwer verständliche, in die Sprachspezifikation gepresste Features, die nur für bestimmte Datentypen gelten. Allen, die Scalas implizite Konvertierungen noch nicht kennen rate ich, das Thema zu googlen. Es lohnt sich!

      Friday, October 29, 2010

      Strukturelle Typsysteme - Ducktyping Light in statischen Sprachen

      In meinem letzten Beitrag habe ich grob die Typen und Kategorien aufgelistet, die für Typsysteme eine Rolle spielen. Da ich die Kategorien alle nur sehr kurz angeschnitten habe, will ich einige der unbekannteren Aspekte noch einmal detaillierter beschreiben.

      Von allen Kategorien / Bereichen zur Einteilung von Typsystemen sind die strukturellen Typsysteme neben dem Multi-Dispatch wahrscheinlich am wenigsten bekannt. Das ist eigentlich sehr schade, denn sie bilden das fehlende Glied zwischen den aus der Objektorientierung bekannten nominellen und den dynamischen Typsystemen. Doch halt.. Fangen wir von vorne an:

      Die meisten Sprachen mit statischen Typsysteme verwenden ein nominatives Typsystem (auch als nominelles  Typsystem bezeichnet). In nominativen Typsystemen müssen die Typen an allem, was nach außen sichtbar ist (=> Methoden) explizit annotiert werden und schränken hier die möglichen Wertemengen auf den benannten (=> nominellen) Typ ein. Das härteste Beispiel hierfür ist C. Einen etwas flexibleren Weg gehen nominative Typsysteme, die die Subtypisierung erlauben. In der Praxis werden diese Typsysteme auch als "Objektorientiert" bezeichnet. In diesen Typsystemen ist es möglich, nicht nur den Typen selbst an eine Methode zu übergeben, sondern es sind auch Subtypen dieses Typs erlaubt. Soweit wahrscheinlich nichts neues...

      Was aber sind strukturelle Typsysteme? Strukturelle Typsysteme sind relaxter als nominelle Typsysteme bei der Gültigkeit. Sie definieren den Typ nicht anhand des Namens, sondern anhand seiner Schnittstelle. Die Schnittstelle kennen auch nominelle Typsysteme: Sie besagt überlichweise, welche Operationen auf einem Typ möglich sind, z.B. isEmpty(), canJump() etc.
      Der große Unterschied ist nun aber, das bei strukturellen Typsystemen die Beschränkung der Subklassenbildung wegfällt: Ein Wert entspricht dann einem bestimmten Typ, wenn er alle Methoden der Schnittstelle implementiert, unabhängig davon, ob er vom diesem Typ ableitet.

      Beispiel (Scala)

      type Duck = {
        def quack()
        def swim(speed: Int)
      }

      class Swan {
        def quack {
          println("swan")
        }
        def swim(speed: Int){
          println("Is swimming")
        }
      }

      object Main{
        def main(s: Array[String]){
          val duck: Duck = new Swan()
          duck.swim()
        }
      }

      Das Ergebnis: Das Programm wird vom Compiler akzeptiert, obwohl ein Swan nicht von Duck erbt!
      Das ist ja auch vollkommen korrekt, weil der Compiler leicht verifizieren kann, das Swan alle Requirements der Schnittstelle Duck erfüllt und sich damit ordungsgemäß als "Duck" verwenden lassen kann.
      Wie der Name schon andeutet: Ja, es handelt sich hierbei um ein Konstrukt das dem sehr ähnlich ist, das dynamische Sprachen auch als Duck-Typing bezeichnen. Strukturelle Typsysteme ermöglichen es, dieses dynamische Konstrukt in einem statischen Rahmen auszudrücken.

      Strukturelle Typsysteme sind dadurch deutlich mächtiger als nominelle Typsysteme. Insbesondere entfällt das Problem, dass man in einem Fremdsystem normalerweise keine vorhandenen Typen mehr anpassen kann. So ist es z.B. nicht möglich, java.util.List auch in einem anderen Kontext zu benutzen, in dem man eine Schnittstelle hat, die z.B. nur die Methode "isEmpty" verlangt, obwohl der Compilr dieses Konstrukt als sicher identifizieren kann. Warum? Weil man der Klasse java.util.List keine neuen Schnittstellen mehr hinzufügen kann!

      Außerdem gibt es noch einen weiteren Vorteil, den man am besten in Haskell nachvollziehen kann: In einem strukturellen Typsystem ist es theoretisch möglich, ein komplettes Programm typsicher zu schreiben, ohne ein einziges Mal eine Typannotation zu verwenden. Der Compiler ist (fast) immer in der Lage, einen entsprechenden strukturellen Typ ad-hoc festzustellen.

      Beispiel (fiktives Scala)
      def walk(person, steplength, distance){
        val steps = 0
        while (steps < distance){
          person.step(steplength)
          steps += steplength
        }  
      }

      In diesem kleinen Programm kann der Compiler die beiden Typen steplength, und distance relativ leicht anhand des typs step als int identifizieren. Was aber mit Person? Für Person reicht es, wenn er intern einen neuen strukturellen Typ definiert, der wie folgt aufgebaut ist:

      type = {
        def step(steplength: Int)
      }

      Es ist also möglich, Typen implizit durch Typinferenz zu ermitteln und zur Validierung von Methoden zu verwenden! Auf diese Weise kommen strukturelle Typsysteme der Ausdruckskraft der dynamischen Sprachen sehr nahe, haben jedoch nicht deren Unsicherheit! Es können im obigen Beispiel nämlich wirklich nur Werte übergeben werden, die auch die Methodensignatur von "step" aufweisen. Dynamische Sprachen werden sich hingegen erst zur Laufzeit mit einer Exception "beschweren".

      Anmerkung: Die obige Typinferenz an Methoden in Scala ist derzeit übrigens nur fiktiv: Scala verwendet zwar ein strukturelles Typsystem, erzwingt aber stets die Angabe der Typen an Methodensignaturen. Primär geschieht dies wahrscheinlich aus Performancegründen, da strukturelle Typen auf der JVM nur per Reflection umgesetzt werden können.

      Ein häufiger Vorwurf gegenüber struktrullen Typsystemen ist, dass sie unsicherer sind als nominelle Typsysteme, da strukturelle Typen zu "leicht" vertauscht werden können. Diesen Vorwurf halte ich aber nicht für sehr valide, da deratige semantische Typfehler nur sehr selten vorkommen. Und selbst wenn: Nominelle Typsysteme können als eine Unterkategorie der strukturellen Typsysteme verwendet werden. So ist es möglich, in einem grundsätzlich flexiblen strukturellen Typsystem auch die mit härteren und "sicheren" Anforderungen versehenen nonimellen Typsysteme einzusetzen.

      Das populärste Beispiel hierfür ist Scala. Eigentlich verwendet die Sprache ein strukturelles Typsystem. In der Praxis wird man aber immer "objektorientiert" mit nominativen Typen, den Klassen der Objektorientierung, arbeiten. Strukturelle Typen wird man nur dann einsetzen, wenn dies aufgrund fehlender Vererbungsbeziehungen nötig wird.

      Links
      http://en.wikipedia.org/wiki/Structural_type_system

      Übersicht: Eigenschaften von Typsystemen

      Während es beim letzten Mal eher um die Unterscheidung zwischen rein klassenbasierten Typsystemen und dem Zusammenhang von Typparametern und Klassen ging, stehen diesmal ganz generisch die Eigenschaften von Typsystemen im Mittelpunkt.

      Typsysteme... Was genau sind eigentlich Typsysteme? Möglichkeiten zur Einschränkung / Erklärung von Typsystemen gibt es unzählige. Der folgende Artikel soll kurz einige der wichtigsten Eigenschaften aufzeigen. Da Typsysteme die wichtigste Eigenschaft einer Programmiersprache sind bzw. vielleicht sogar die einzige Aufgabe, lohnt es sicherlich, sie etwas genauer zu betrachten.

      Die meisten diese Bereiche werden übrigens in follow-up Artikeln noch etwas genauer beleuchtet werden. Das hier ist nur eine ganz schnöde Auflistung der Features.

      A) Stark vs Schwach
      • Erlaubt das Typsystem implizite Konvertierungen (Type Coercions) von einem Typ in den anderen?
      • Beispieel: 3 + "hallo"; 3 * 3.4. Ist dies möglich?  Welches Ergebnis wird erzeugt?
      • Grundsätzlich ist schwache Typisierung nicht als Nachteil zu sehen. Bei Sprachen die Typen aber zu relaxt handhaben kann es schwieriger werden, richtigen Code zu erzeugen, weil sich schneller Fehler einschleichen können.
      • Eine Besonderheit stellt die Sprache Scala dar: In der Sprache selbst sind keine impliziten Konvertierungen definiert, jedoch ist es möglich, dass der Programmierer diese selbst definiert und explizit in bestimmte Module importiert.

        B) Typenableitung
        • Können neue Typen durch Kombination / "Vererbung" von vorhandenen Typen abgeleitet werden?
        • Populärstes Beispiel: Objektorientierung
        • Ermöglicht fast immer die Single-Dispatch-Polymorphie (s.o.)
        • Kovarianz und Kontravarianz: Spezielle Regeln die für die Parameter von Typen (Generics) und die Parameter von abgeleiteten Methoden gelten.

        C) Typzugehörigkeit: Nominativ < Strukturell < Dynamisch
        • Nominativ
          • Erlauben nur Werte die vom selben Typ (Namen) sind
          • Ohne Typenableitung: Starres und unflexibles Typsystem wie das von C.
          • Mit Typenableitung: Objektorientierung (Java, C++, C#, ...). Hier stellt die erzwungene Beziehung zwischen Objekten immer noch eine sehr starke Einschränkung der möglichen Werte dar.
        • Strukturell
          • Typen definieren mit ein oder mehrere Methoden eine Schnittstelle (ähnlich den Interfaces in Java oder C#)
          • Ein Wert entspricht einem Typ, wenn er alle Methoden implementiert. Dies ist unabhängig davon, ob er ein Subtyp von diesem Typ ist.
          • Deutlich höhere Flexibilität - dem Duck-Typing sehr ähnlich
          • Typen können zu jedem beliebigen Zeitpunkt ad-hoc definiert werden, ohne dass sie in eine Vererbungshierarchie eingebracht werden müssen
          • Nominative Typsysteme können eine Unterklasse der strukturellen Typsysteme bilden. So ist Scala z.B. strukturell typisiert, praktisch wird aber fast immer das nominative objektorientierte System verwendet.
        • Dynamisch (Duck-Typing)
          • Ähnlich der strukturellen Typisierung, es werden aber gar keine Anforderungen mehr an Typen gemacht. Ein Wert muss einfach nur die Methoden unterstützen, die im Code verwendet werden. Tut er dies, läuft der Code. Tut er dies nicht.. bang!
          • Keine Typprüfung mehr durch den Compiler
          • Grundsätzlich etwas schlechtere Performance, die aber kein "showstopper" sein sollte
          • Typische Eigenschaft aller dynamisch typisierten Sprachen, lokal beschränkt aber auch in statischen Sprachen wie C# möglich.
          • In dynamischen Sprachen sind Variablen nicht typisiert, so dass mit einer Zuweisung der Typ einer Variablen wechseln kann. Es ist also möglich in einer Variable zuerst einen String und später einen Int zu halten.
          • Schwach typisierte dynamische Sprachen erzeugen meist schwer nachvollziehbaren Code (PHP). Dies wird meist als Vorwurf gegen alle dynamischen Sprachen benutzt - es gibt aber auch viele stark typisierte Sprachen wie z.B. Phyton auf die dies nicht zutrifft.

        D) Polymorphie
        Polymorphismus ("Viele Formen") bedeutet in der Programmierung, dass ein Bezeichner abhängig vom Kontext unterschiedliche Bedeutungen haben kann.
        • Ad-Hoc-Polymorphie (Compilezeit)
          • Statische Methoden- und Operatorenüberladung
            • Effektiv dasselbe. Operatoren sind eigentlich nur Methoden mit einer anderen Schreibweise.
            • Bezeichnet die Fähigkeit, einem Bezeichner statisch mehrere Methoden mit verschiedenen Parameterlisten zuzuordnen
          • Typparametrisierung (Generics)
            • Ermöglicht ad-hoc Typannotationen an Typen, um spontan aus Templates neue Typen zu bilden. Aus einem Set[T], wobei T die Einfügemarke ist, kann so ein Set[String] oder auch ein Set[Int] werden.
            • Nur für statisch typisierte Sprachen interessant, um Optimierungen vorzunehmen und auf unsichere Casts zu verzichten
            • Zusammen mit der Subtypisierung ergeben sich hier einige sehr komplexe Kombinationsmöglichkeiten durch die Kovarianz und Kontravarianz
        • Dynamische Polymorphie / Dispatch (Laufzeit)
          • Single-Dispatch
            • Subtypenbildung (Typenableitung) ist möglich
            • In der Objektorientierung: Vererbung
            • In der strukturellen Typisierung als Typklassen bezeichnet
          • Multi-Dispatch
            • Dynamische Methodenüberladung zur Laufzeit
            • Anders als beim Single-Dispatch können mehrere Parameter einer Methode überladen sein
            • Auch als Multi-Methods bezeichnet

          E) Typinferenz
          • Hauptsächlich bei statisch typisierten Sprachen wichtig: In welchem Umfang muss der Programmierer Typannotationen bei Variablen und Methodenparametern vornehmen, und inwieweit können diese "wegfallen"?
          • Sprachen, die Typinferenz ermöglichen, machen die Typannotationen stets optional, sie können also verwendet werden, müssen aber nicht. Dadurch wird der Code meist deutlich kürzer und lesbarer.
          • Falls die Sprache Typparameter ermöglicht, können auch meist diese durch die Typinferenz ermittelt werden
          • Arten
            • Nur Rückgabewerte (C, C++, Java, ...)
              • Bei Rückgabewerten ermittelt der Compiler den Typ zur Prüfung
              • Ermöglicht das Method-Chaining: new String("A").concat("B).concat("C")
              • Typannotationen sind stets erforderlich
            • Lokal (Scala, C# 3.0)
              • Type-Inferrence funktioniert nur innerhalb eines begrenzten Scopes, nicht aber auf dem Method-Level. Dadurch müssen alle lokalen Variablen und nicht typisiert werden
              • Bei Methoden müssen die Eingabeparameter, meist aber nicht die Rückgabewerte typisiert werden. Letztere können aus den Rückgabewerten der Methode abgeleitet werden
            • Global (Haskell)
              • Auch Methoden müssen nicht oder nur selten annotiert werden
              • Eine volle Typinferenz erfordert zwingend ein strukturelles Typsystem
              • Gerade bei vollständiger Typinferenz ist es von Vorteil, das Typen immer noch explizit annotiert werden können. Schließlich haben Typannotation an Methoden auch einen Vorteil: Sie dokumentieren, welche Werte erlaubt sind.
          • In den meisten dynamischen Sprachen können Typen gar nicht annotiert werden. Sie haben also automatisch eine Art "vollständiger" Typinferenz ohne Typsicherheit.

          Thursday, October 28, 2010

          Typ > Klasse. Warum Klassen auch in Java nur eine Untermenge der möglichen Typen sind

          In diesem Beitrag geht es primär darum, den nebulösen Begriff des Typsystems etwas genauer zu definieren. Vor allem soll (in einem Follow-Up) aufgezeigt werden, dass das "objektorientierte Paradigma" auch nur ein Sonderfall der etwas generelleren und mächtigeren "strukturellen" Typsysteme ist. Und es soll gezeigt werden, warum Java seit 1.5 zwischen Klassen und Typen unterscheidet!

          Am Anfang war alles ganz einfach. Vielleicht etwas zu einfach: Da Sprachen mit statischen Typsystemen im Vergleich zu den dynamischen fast zwangsläufig dazu tendieren, komplex zu sein, musste eine Vereinfachung her. Also hat man sich beim Design von Java wohl so ungefähr folgendes überlegt:

          Diskussion zwischen James und dem Sonnengott
          J: "Typen sind schon ein ganz schön komplexes Thema. Ich mag Typen. Aber ich will es einfach halten."
          S: "Unser Business-Plan. Wir brauchen Ergebnisse! Lösungen!"
          J: "Jaaa... Moment!"
          S: <Uhrtick>
          J: "Ok, wie wärs damit: Typ == Klasse! Die einzig zulässigen Typen sind Klassen!"
          S: "Gut. Die Propaganda ist in schon in Arbeit. Typ == Klasse. Das wird das Fundament der ganzen OO werden!"
          J: "Und wenn wir uns irren? Oh.. Und ich hab scheiße gebaut. Was ist mit den Primitiven? Und den Arrays?"
          S: "Klappe!"

          So oder so ähnlich muss es wohl ergegangen sein. Egal. Worum es mir heute geht ist nur folgendes:
          Typen sind keine Klassen... aber Klassen sind Typen.

          Fangen wir wie folgt an: Und zwar mit einer rudimentären Definition:

          Typ = Einschränkung der möglichen Werte für einen Bezeichner (üblicherweise eine Variable oder ein Funktionsparameter). Typen stehen bei den statischen Typsystemen im Mittelpunkt, die versuchen durch eine Validierung der Typen möglichst viele Fehler von vornherein durch einen Compiler zu verhindern.

          Klassentyp = Einschränkung der möglichen Werte für einen Bezeichner auf einen bestimmten Typ, der von der angebenen Klasse oder einer von ihr abgeleiteten Klassen sein muss. Offizielle Bezeichung: Nomineller Typ mit Subtypisierung.


          Mögliche Typen in Java

          Der Klassentyp ist nur ein Sonderfall des generischen "Typs". In Java war die Klasse in Java vor 1.5 der einzig zugelassene Typ - Arrays / Primitive sind Fehler im Sprachdesign, die ich hier ignoriere. Bis heute ist sie traditionell auch der am häufigsten anzutreffende Typ. Durch die Generics mag sich dies grundlegend geändert haben. Aber das interessante ist: Selbst in Java < 1.5 gibt es schon einen Unterschied!

          Beispiel 1: Subklassenbildung

          List list = new ArrayList();
          Bezeichner: list;      Klassentyp: List;       Klasse: ArrayList;    Wert: []

          Das Bezeichner mit einem Obertyp auf Objekte von einer Subklasse verweisen können, ist natürlich in der Objektorientierung ein alter Hut. Aber es ist eine sehr wichtige Erkenntis! Wichtig deshalb, weil durch das obige Konstrukt das Typsystem weniger weiß als es wissen müsste, da ich seine Wertebereich bewusst stärker eingeschränkt habe, als es nötig gewesen wäre. Ich hätte ja auch einfach das folgende schreiben können: ArrayList list = new ArrayList(). Dafür könnte ich dann auch keine LinkedListen mehr für die list-Variable verwenden.

          Beispiel 2: Typparameter

          List<String> list = new ArrayList<String>();
          Bezeichner: list;      Klassentyp: List<String>;       Klasse: ArrayList;    Wert: []

          Was dieses Beispiel so interessant macht, ist das hier am deutlichsten wird, das Generics in Java nur für das Typsystem interessant sind und das Typen mehr als nur Klassen sind. Ich erschaffe hier zur Laufzeit anhand der Typparameter einen neuen Typ - List<String>. Die Klasse hingegen hat sich dadurch nicht geändert, sie weiß nicht einmal etwas über den Typ. Im besten Fall könnte ich in einer Sprache ohne erasure noch wissen dass ich hier eine Klasse mit einem Typ String (nicht: Klasse String) instanziert habe.
          In Sprachen wie Java < 1.5 ohne Typparameter, in denen Typen und Klassen immer dasselbe sind, lässt mich das Typsystem an der wichtigsten Stelle hängen: Reine Klassentypen sind nicht mächtig genug um damit alle wichtigen Typen abbilden zu können. Praktisch bedeutet dies, dass ich in diesen Sprachen sehr oft mit "up-casts" arbeiten muss und damit alle meine Datenstrukturen nicht typsicher sind.

          Beispiel 3: Typparameter können mehr sein als nur Klassen

          Java nennt sie Generics, aber dennoch ist die Bezeichnung Typparameter die eigentlich wichtige. Die meisten können sicher verstehen, das Typparameter wie der Name sagt, Typen, keine Klassen erwarten. Ich will es dennoch kurz erklären:

          Map<String,Set<Integer>> map = new HashMap<String,Set<Integer>>();

          Alles klar? Wenn ich nur Klassen benutzen dürfte, wäre die Bezeichnung illegal, da Set<Integer> ein Typ ist, die Klasse hingegen nur Set. Das wäre aber ziemlicher Dreck und wird deshalb nicht gemacht. Merke: Es heißen Typparameter, nicht Klassenparameter. Und: Sie sind der Hauptgrund dafür, dass Typen und Klassen sich seit Java 1.5 unterscheiden.

          Beispiel 4: Typen können Klassen kombinieren

          Bis hierhin mag noch alles lustig gewesen sein, doch jetzt kommt etwas dass die meisten wahrscheinlich noch nicht wissen: Typen können sich sogar aus mehreren Klassen zusammensetzen (Kombinierte Typen):

          interface X{

            <A extends Set<?> & Comparable<Set>> void action(A a);

          }

          Diese Methode erwartet als Eingabeparameter eine Variable von einem Typ, der sich aus den Typen Set und Comparable zusammensetzt. Hier wird ein neuer Typ definiert, der sich aus vorhandenen zusammensetzt. Dies ist ähnlich den normalen Typparametern, die die das definieren von "Ad-hoc" Typen aus existierenden Typen ermöglichen. Aber hiermit ist eine noch größere Flexibilität gegeben: Der kombinierte Typ enthält alle Methoden des Comparable UND des Set interfaces, stellt also quasi eine neue Schnittstelle dar OHNE dass vorher eine explizite Vererbungsbeziehung definiert werden müsste.

          An dieser Stelle soll nicht über Sinn und Zweck von aus Klassen zusammengesetzten Typen gesprochen werden - diese sind meist eher bescheiden. Viel interessanter ist aber, das Java hier ein Feature hat, das Typen mächtiger macht als Klassen. Wie so oft bei Java ist hier ein mächtiges Feature, flexible Typendefinition ohne direkte Vererbung, vorhanden, aber so verkrüppelt und schwach dass es meist nur begrenzten Sinn macht.

          Für alle die sich fragen was ich meine: Java basiert seit 1.5 fast auf einem strukturellen Typsystem. Die hier genannten Veränderungen mit den zusammengesetzten Typen haben nichts mehr mit den bisher bekannten starren Typhierarchien der Objektorientierung zu tun. Aber: Java geht den entscheidenden Schritt nicht: Es bleibt ein starres System mit schlechter Erweiterbarkeit. Es unterstützt nicht die flexible Definition von Typen, die überhaupt nicht mehr auf Klassen basieren, sondern erlaubt es nur, vorhandene Klassen zu kombinieren.

          Ich werde im nächsten Artikel genauer auf das Thema der Typsysteme eingehen. Im Mittelpunkt wird dabei der Vergleich der statischen nominellen Typsysteme (C), der nominellen Typsysteme mit Subtypen (Java, C++) und der strukturellen Typsysteme (Haskell, Scala) stehen.

          Wednesday, October 27, 2010

          Collections - Was sie sind und wie sie verwendet werden sollten

          Die folgende Abhandlung soll einen zusammengefassten Überblick über diese Strukturen geben. Es sollen Designentscheidungen aufgezeigt werden, die bei der Implementierung derselben in einer Programmiersprache eine Rolle spielen. Da Collections in fast jeder Sprache als Basisbibliotheken oder direkt auf dem Sprachlevel zur Verfügung stehen, ist es schon erstaunlich, wie viele Schnitzer sich hier erlaubt werden.

          Collections -> Ansammlungen von Werten. Fast alle Programmiersprachen kennen derartige Konstrukte, um Operationen mit mehreren gleichartigen Werten zu vereinfachen. Für die meisten Sprachen scheint das Array als technisch einfachste und schnellste Datenstruktur das Mittel der Wahl zu sein. Dies mag einer der Gründe sein, warum es meist auch die einzige Datenstruktur ist, die mit syntaktischem Zucker direkt auf dem Sprachlevel supported wird.

          Allerdings wissen die meisten Entwickler auch, dass Arrays nicht die einzigen Collections sind. Es gibt neben Arrays noch Sequenzen, Mengen und natürlich auch Map-Strukturen, die bestimmten Keys entsprechende Values zuordnen, und all diese Typen meist in zahlreichen Ausprägungen . Viele moderne Sprachen bilden für diese unterschiedlichen Strukturen bereits Typen an, die drei Hauptkategorien bilden:

          • Sequence[A] (Seq[A], List[A](Java-Kuriosum) )
            • Abfolge von Elementen. Mehrfachvorkommen ist möglich, da primäre Eigenschaft die "Reihenfolge" ist
            • Die bekanntesten Vertreter dieser Art sind das Array, der Vektor (Array mit automatischer Vergrößerung), die Single-Linked-List und die Double-Linked List.
            • Es lässt sich für Sequenzen anhand der Reihenfolge stets ein indexbasierter Zugriff implementieren. Allerdings ist dieser nur bei Arrays effizient und sollte bei anderen Strukturen vermieden werden. Besser sind stets generische Iterationsmechanismen
          • Set[A]
            • Enthält (mathematische) Mengen, in denen jedes Element nur einmal vorkommen kann.
            • Sets können wie Sequenzen iteriert werden, jedoch ist die Reihenfolge nur selten deterministisch und kann deshalb unter keinen Umständen vorrausgesetzt werden. Aus diesen Gründen bieten Sets auch, obwohl theoretisch möglich, keinen Indexzugriff an.
            • Die Schnittstellen von Sequenzen und Sets sind meist recht ähnlich. Der Hauptunterschied liegt hier in der Verwendung.
          • Map[A,B]
            • Dient dem Mapping von Key auf Value. Keys müssen unique sein, für Values gilt diese Beschränkung hingegen nicht.
            • Am häufigsten werden hashcode- oder baumbasierte Strukturen zum Mappen eingesetzt.
            • Ähnlich wie Sets lassen sich auch Maps nur meist nur nicht-deterministisch iterieren. Anstatt über einzelne Elemente iteriert man hier über (Key,Value)-Paare (auch Tupel genannt).
          In typisierten Sprachen werden diese drei Typen dann noch einer Oberkategorie zugeordnet:

          Iterable[A] (auch: Traversable, Collection, ..)
          Enthält die Basisstruktur, um über 1..n Elemente aus einer Folge, Menge, Folge von Schlüssel-Wert-Paaren zu iterieren. Zusätzlich werden oft noch Funktionen angeboten, die sich direkt durch die Eigenschaft der Iterierbarkeit implementieren lassen (isEmpty-Prüfung, Filtern von Werten, Umwandeln der Werte, ...)

            Implementierungsweise - Eigenschaften die bei der Implementation von Collections beachtet werden sollten

            1. Anforderungen an die Sprache

            Collections sind grundsätzlich ein Feature, dass für fast alle Sprachen elementar sein sollte. Es sollte aber nicht so elementar sein, dass es auf dem Sprachlevel implementiert wird. Syntaktischer Zucker für einige der Strukturen ist nicht sinnvoll oder wünschenswert. Dies führt meist zu einer bevorzugten Verwendung derselben, obwohl es grundsätzlich nicht die "richtige" Collection für jeden Anwendungsfall gibt. Außerdem schränkt es die Flexibilität der Sprache ein und macht den Zugriff auf unterschiedliche Arten von Collections uneinheitlich!

            Collections sollten immer als zum Grundumfang der Sprache gehörende API's realisiert werden, die sich an der obigen Dreiteilung orientiert. Es gibt keinen Grund, sie wirklich auf das Sprachlevel zu packen. Wenn eine native und einfache Verwendung von Collections ermöglicht werden soll, dann muss die Sprache Operatorenüberladung unterstützen. Nur mit Operatoren lassen sich Collections wirklich in eine Sprache auf dem richtigen Level integrieren.

            Damit Collections sinnvoll in einer statisch typisierten Sprache eingesetzt werden können, muss die Sprache Typparameter (Generics) anbieten. Wie oben aufgezeigt verwenden Collections immer denselben Typ bzw. sollten es zumindest. Falls die Sprache nun statisch typisiert ist und Typparameter nicht zur Verfügung stehen... muss die Typsicherheit durch casts bei jedem Zugriff sichergestellt werden. Das ist absurd, da diese Konstrukte aufwändig sind, aber keine Typsicherheit bieten!  Populäre Beispiele hierfür sind Java 1.4 und .NET 1.0. Hier ist man meist besser beraten, mit Arrays zu arbeiten (die hier auch keine Collections sind?),

            Collections sind einer der Hauptgründe, wegen denen jede statisch typisierte Sprache Typparameter anbieten muss! Sonst ist ihr Typsystem an den entscheidenden Stellen so schwach, dass man besser darauf verzichtet und einfach dynamisch typisiert.

            Man kann sogar noch weitergehen: Dies ist einer der Hauptgründe, wegen denen eine Sprache, die statisch typisiert ist, von vornherein Typparameter in ihrem Sprachumfang enthalten muss! Ansonsten werden sie zwangsläufig später aus den genannten Gründen "nachgerüstet", können sich aber nicht mehr so gut in die Sprache integrieren, als wenn sie von vorn herein da gewesen wären. (-> JDK 1.5). Dazu werde ich noch mal einen eigenen Beitrag verfassen...


            2. Ünveränderlichkeit

            Ein weiteres entscheidendes Kriterium von Collections ist die Unveränderlichkeit: Collections stellen immer Werte dar. Werte sind aber per Definition unveränderlich. Will ich einen Wert verändern, dann muss ich stattdessen durch eine Operation einen neuen Wert erstellen. Wenn ich z.B. zwei Collections verbinde sollte das Ergebnis nicht in einer der beiden Collections gespeichert werden, sondern eine neue Collection ergeben.

            Diese Eigenschaft lässt sich aber nur dann sicherstellen, wenn Collections grundsätzlich unveränderlich sind. Im kleinen Rahmen hat sich diese Erkenntnis bereits bei vielen Sprachdesignern durchgesetzt, die aus den Fehlern von C gelernt haben. So sind Strings in den meisten modernen Sprachen bereits unveränderlich. Das ist einzige komische an der Sache ist nur, dass die Sprachdesigner in dem Zug nicht auch daran gedacht haben, Strings als Collections (Seq[Char]) zu deklarieren und das Konzept gleich für alle Collections zu übernehmen!

            Die fehlende Unveränderlichkeit ist nun einer der Hauptschwachpunkte fast aller Collection-Libraries:
            Alle Standardcollections basieren meist auf Arrays. Arrays sind aber schon per Definition mutable Datenstrukturen, die sich nur begrenzt für immutable Implementatierungen eignen.

            Einige imperativen Sprachen verzichten zudem auf die nötige Zweiteilung in mutable und immutable Collections auf der Interface-Ebene: Java z.B. kennt nicht einmal immutable Interfaces für seine Collections. Stattdessen werden Exceptions geworfen, wenn eine als unveränderlich gekennzeichnete Collection verändert werden soll. Und wieder mal ein Fall, in dem das Typsystem von Java zu schwach ist..

            Die Stärke der immutable Collections liegt darin, dass sie threadsicher, zwischen beliebig vielen Funktionen ausstauschbar und leichter in einem Ablauf nachzuvollziehen sind. Dadurch können sie sicher an allen Schnittstellen verwendet werden, ohne dass es zu versehentlichen Veränderungen kommen kann. Diese Vorteile sind für Code, der leicht verständlich und bereits zur Compile-Zeit verständlich sein soll, entscheidend.

            Mutable Collections haben hingegen auch Vorteile, aber viel weniger als oft postuliert wird. Wenn Werte häufig verändert werden sollen und die Collection zudem noch sehr groß sind, sind mutable Datenstrukturen meist schneller. Da sie aber keine der bei immutable Collections genannten Vorteile haben, müssen sie in sehr begrenzten Scopes gehalten werden. Üblicherweise wird man mutable Collections im inneren (privaten) Scope eines Typs "einsperren" müssen, wenn man wirklich sicher entwickeln möchte. Ihr Anwendungsfall ist also grundsätzlich ein spezialisierter. Immutable Collections hingegen eignen sich generisch für alle Arten von Problemen, weshalb sie grundsätzlich immer vorzuziehen sind.


            3. Threadsicherheit ?
            Eine weitere oft genannte wünschenswerte Eigenschaft ist, das Collections threadsicher sein sollten. Dieses Forderung ist aus der imperativen Entwicklung heraus entstanden und .. vollkommener Blödsinn!

            Threadsicherheit erreicht man über immutable Collections.

            Will man mutable Collections synchronisieren, muss man manuell alle Blöcke synchronisieren, in denen auf die Collection zugegriffen wird. Es reicht nie, nur die Collection zu synchronisieren, da sich weder die Iteration noch der Indexzugriff sauber auf dem Collection-Niveau abbilden lässt! Ebensowenig das gleichzeitige Durchführen mehrere Operationen, z.B. Lesen und Schreiben. Ergo muss man, schon allein aus Effizienzgründen, ohnehin fast immer manuell synchronisieren!

            Deshalb: Vergesst threadsichere Collections!

            Zusammenfassung
            • Collections sollten eine saubere Klassenhierarchie anhand der obigen "Dreiteilung" aufweisen. (Keine Sonderregeln, auch nicht für Arrays)
            • Realisierung sollte als API und nicht in der Sprache erfolgen. Collections müssen erweiterbar sein!
            • Sprache: Operatorenüberladung sollte möglich sein
            • Statische Sprache: Typparameter müssen möglich sein (und auch für Arrays gelten)
            • Die Sprache sollte sowohl mutable als auch immutable Collections anbieten.
            • Threadsicherheit ist masslos überschätzt und muss in Collections nicht berücksichtigt werden. (Erklärung s. oben)

            Links

            Eine der schönsten und vollständigsten Collections-Libraries hat meiner Meinung nach Scala, deshalb hier ein Link auf das sehr gute Tutorial zu der Collection-Hierarchie. Auch für Nicht-Scala-Fans empfehlenswert!
            Scala Collections Overview

                Tuesday, October 26, 2010

                @Deprecated null => Sinnvoller, typisierter Ersatz für "nichts"

                Wie kann man "nichts"-Werte ohne Null sinnvoll abdecken?
                Die Antwort auf die Frage zum Glück relativ einfach, denn es gibt bereits Typen die einen solchen "nichts"-Typ kennen: Sowohl Strings als auch Collections als auch Arrays kennen eine leere Menge, die nach allgemeiner Empfehlung auch immer anstelle von "nichts" verwendet werden sollte, wenn man mit diesen Typen hantiert.

                Was haben alle diese Werte gemeinsam, was dazu führt, dass sie einen "nichts"-Wert kennen?
                 -> Sie sind Collections und haben eine Kardinalität. Jeder dieser Typen enthält 0..n Werte eines bestimmten Typs. Die Nullmenge stellt dabei immer den "nichts"-Wert dar.

                Bei den Collections kann man grundsätzlich zwei Haupttypen dieser Aufzählungen gleicher Werte unterscheiden: Mengen und Sequenzen. Mengen (Sets) enthalten beliebige viele unterschiedliche Werte eines Typs. Sequenzen (Sequences) enthalten eine fest vorgebene Abfolge von Werten (z.B. Listen, Arrays, Queues, Stacks). Aber beide können 0..n Werte enthalten, und bei beiden kann man die Wertmengen durchlaufen. (In dem Zusammenhang sei erwähnt, das aus irgendwelchen Gründen viele Sprachen Strings und Arrays nicht als normale Sequenzen betrachten, aber das nur als Kuriosum am Rande.)

                Die Antwort darauf, wie man "nichts" sinnvoll abdecken kann scheint also irgendwie mit Collections, primär mit Mengen zusammenzuhängen.. Normale Collections eignen sich nun aber nicht für den genannten Usecase, denn man will zwar "nichts" haben, aber grundsätzlich nicht beliebig viele Werte (und die damit verbundene Komplexität) abdecken. Es läuft nicht auf 0...n hinaus, sondern auf eine Menge von 0..1 statt der normalen 1..1 Beziehung.

                Ein neuer Datentyp: Option

                Damit haben wir nun unseren Zieltyp - eine Menge von 0..n: Option[T

                Option ist ein unveränderlicher Typ der genau zwei Werte haben kann:
                • None => eine Konstante, die den leeren Wert darstellt) 
                • Some(t) => ein Wert, der den gesetzten Zielwert enthält
                Schnittstelle: Es reicht prinzipiell, die folgenden Collection-Operationen anzubieten:
                iterator() => erzeugt einen Iterator, um über die Menge zu iterieren
                isEmpty() => true für None, false für Some

                Die Verwendung z.B. in Java könnte wie folgt aussehen (eine Implementierung wird noch nachgereicht).

                class Alien{
                   Option<Gender> gen = Option.none();
                   Option<Hair> hair = Option.some(Hair.Green);

                   boolean isHumanlike(){
                     return !gen.isEmpty() && !hair.isEmpty();
                   }
                   
                   String getHairColor(){
                     for (Hair h: hair){
                       return h.toString();
                     }
                     return "";
                   }
                   
                   Option<Gender> getGender(){ return gen; }
                   Option<Hair> getHair(){ return hair; }
                }


                Vorteile durch die Verwendung von Option
                Soweit so gut.. Die erste Frage die jetzt kommen dürfte ist: Was bringt ein solcher minimaler Typ? Die Antwort liefert der obige Quelltext:
                • Keine NoPEs: Der Compiler zwingt mich dazu, einen Option-Wert mit isEmpty() zu prüfen bzw. mit for-each zu zerlegen, wenn ich an den Inhalt kommen möchte.
                • Die Operationen sind vollkommen sicher: Keine der beiden Operationen kann unter irgendwelchen Umständen Exceptions werfen.
                • Der Code ist kurz: Er ist zwar etwas länger als ein reiner null-check (s. getHairColor()), aber immer noch handhabbar. Außerdem sollten optionale Werte IMMER die Ausnahme sein. Die Performance ist ebenfalls extrem hoch, wenn auch deutlich unter dem Typunsicheren nullcheck.
                • Er ist selbstdokumentierend: Geht wieder in die Richtung des ersten Punkts. Durch die Typannotation mache ich nach außen jedem klar was dieser Code macht und wie er zu benutzen ist. Deshalb kann ich auch ohne Probleme den Zugriff auf die Felder zulassen und sie als Außenstehender auch sorglos benutzen.

                Abschluss
                Der "Option"-Typ wird in vielen funktional orientierten Sprachen als Standardtyp angeboten, die im Allgemein ein deutlich besser designtes Typsystem verwenden als die meisten objektorientierten Sprachen wie Java.
                In Haskell ist er als Maybe[a] => Nothing <-> Just[a] bekannt,
                das hier verwendete Namensschema habe ich hingegen aus Scala übernommen, da ich es etwas aussagekräftiger finde.

                Ich hoffe das die Infos hier relativ interessant waren und wünsche viel Spaß dabei, den Unterschied zwischen "nichts" und "etwas"; und den Kardinalitäten 1:1, 0:n und 0:1 herauszufinden!

                Links:
                http://james-iry.blogspot.com/2007/08/martians-vs-monads-null-considered.html
                http://www.codecommit.com/blog/scala/the-option-pattern

                Eine Kontroverse in der, eher schwach, gegen den Option-Typ argumentiert wird:
                http://java.dzone.com/articles/why-scala%E2%80%99s-%E2%80%9Coption%E2%80%9D-and?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+javalobby%2Ffrontpage+%28Javalobby+%2F+Java+Zone%29

                Monday, October 25, 2010

                Safe De-Reference? NoPE!

                Die herrliche Nullpointerexception (auch "NPE" bzw. "NoPE" von ihren Fans genannt) ist einer der treuesten und langlebigsten Begleiter eines Java-Entwicklers. Auch andere Sprachen wie C#, C und ähnlichen Sprachen kennen das Problem, zum Teil sogar mit noch fataleren Folgen. Die Frage die sich aber doch stellt ist: Warum ist es so? Warum ist die NoPE immer und überall König der Exceptions / Abstürze / Speicherfehler?

                Ursachen
                1. Null ist in vielen Sprachen wie Java vereinbarter Kontrakt "optionaler" Werte, d.h. von Werten die vllt nicht da sind. Ein Beispiel dafür sind Lookup-Operationen, bei denen ich mit einem Schlüssel nach einem Wert zu suche: Diese Operation muss nicht immer einen Wert zurückliefern - falls es zu dem Schlüssel keinen Wert gibt muss ich "nichts" zurücklieferen. => null. (Bsp: java.util.Map.get(key))
                2. Nicht initialisierte Werte: Null wird auch dann benutzt wenn ein Wert eines Datentyps, z.B. die Property von einem Objekt, im Konstruktor nicht gesetzt wurde. Standardmäßig setzen viele Programmiersprachen in diesem Fall den default "null" => wieder "nichts".
                3. Designfehler: Während die beiden bisherigen Varianten meist in der Sprache vereinbart sind, gibt es auch noch den dritten Fall: Hilflosigkeit. Viele Menschen, so auch Entwickler, scheinen Fehler lieber vertuschen zu wollen statt um Hilfe zu schreien. In Programmcode ausgedrückt bedeutet dies, dass sie in Objektfeldern null setzen oder aus Methoden null zurückgeben wenn etwas fehlgeschlagen ist dass funktionieren muss. Ein Beispiel dafür sind kritische Initialisierungsroutinen ohne die das Programm nicht durchgeführt werden kann, die aber z.B. durch Fehler in Dateien dennoch fehlschlagen können. Was ist die Konsequenz: => in irgendeinem Feld lauert jetzt.. null.
                Das sind die drei Standardfälle in denen Null verwendet wird:
                •  Leerer Defaultwert
                • "Nichts"-Rückgabewert
                • Ergebnis einer fehlgeschlagenenen Operationen.
                Alle diese Fälle ziehen einen Rattenschwanz von Problemen nach, denn ob ein Wert null sein kann ist für die Entwickler, die die Routinen verwenden meist kaum zu erkennen. Die meisten Routinen dokumentieren zudem mögliche null-Werte nicht oder führen sie erst nach einem Refactoring ein. Eine NoPE kann so selbst dann eintreten, wenn der Entwickler, der die Funktion benutzt, eine für Entwickler unübliche Vorsicht hat walten lassen. Tja.. und was machen wir nun?

                Werden wir für immer dazu verdammt sein, unseren Code mit Nullchecks an den merkwürdigsten Stellen auszustatten und vor jedem Aufruf einer Funktion Stoßgebete an den Vater der Maschine senden müssen? 

                Hm. Ich denke es gibt durchaus erfolgversprechendere Lösungen.

                Warum ist null kein Fehlerwert, und was macht man stattdessen?
                Eliminieren wir von den zuerst genannten drei Fällen direkt die Nummer #3.
                null als Fehlerwert zu verwenden, wenn etwas fehlschlägt ist:
                (a) die häufigste Ursache von NoPE'. Man rechnet nicht mit Nullwerten an diesen Stellen und kann meist gar nicht weitermachen, wenn bestimmte kritische Werte auf einmal null sind. Eine Nullprüfung würde hier meist nicht weiterhelfen.
                (b) Sachlich falsch. Was vorliegt, ist meist einfach nur ein Fehler, und kein leerer Wert.. Die einzig vernünftige Reaktion auf einen Fehler ist aber das Werfen einer Exception (=> eskalieren statt aussitzen). Wenn etwas unerwartet fehlschlägt, ist dies die einzige Art und Weise (in Java und C#) dies eindeutig zu kommunizieren und auch direkt klarzumachen, von wo der Fehler gekommen ist.
                Also: Werft eine (checked) Exception wenn etwas nicht behandelbar ist!
                Vergesst null für diesen Fall! Der Caller wird meist dazu gezwungen sein, auf null mit einer Exception zu reagieren. Da könnt ihr ihm gleich zuvorkommen.

                Warum ist Null als "Nichts" einfach nur falsch?
                Es bleiben nur noch zwei Fälle übrig, die semantisch aber effektiv dasselbe Konstrukt behandeln: Null wird hier gleichgesetzt mit "nichts", d.h. null repräsentiert die Unterscheidung zwischen einem gesetzten Wert und dem Fehlen desselben. Dieses Verhalten ist, auch wenn es sich in fast allen Programmiersprachen durchgesetzt hat, sachlich vollkommen falsch.

                Ein Hinweis darauf, dass null nicht "nichts" íst, liefert schon der Compiler: Er ist nämlich in allen Sprachen, die null-referenzen erlauben, nicht in der Lage zwischen null und einem gesetzten Wert zur Compilezeit zu unterscheiden. Ergo: Die falsche Verwendung von null kann nicht durch einen Compiler geprüft werden! Den besten Hinweis darauf liefert die Tatsache, dass die Verwendung von null als Wert zu einem Laufzeitfehler führt, nämlich zu einer NoPE!

                Laufzeitfehler sind aber, der "hochgelobten" Typprüfung zum Trotz, nichts anderes als Hinweise darauf dass hier das Typsystem der statischen Sprachen wie Java schlicht und ergreifend unvollständig ist. Das mag einer der Gründe dafür sein dass dynamische Sprachen sich einer solchen Beliebheit erfreuen: Die Typsysteme der meisten statischen Sprachen sind an den kritischsten Stellen löchrig: Es gibt Konstrukte, die Compilersicherheit auch bei optionalen Werten ermöglichen. (Dazu später mehr). Dennoch wurde sich bei Sprachen wie Java von vornherein dagegen entschieden diese anzubieten.
                Aber warum sollte man ein statisches Typsystem verwenden, dass einen an den wichtigen Stellen unnötig im Stich lässt?

                Ich werde die korrekte und triviale "Nichts"-Interpretation, die für optionale Werte nötig ist, in meinen nächsten Post vorstellen. Sie stammt ursprünglich und zwangsläufig aus den funktionalem Umfeld Haskells, das den Wert "null" für Referenzen gar nicht kennt.

                init()

                Servus zusammen, und willkommen zu meinem neuen Blog!

                Während mein anderes Blog eher als Template zum Erstellen und Sortieren von Gedankenströmen dient, wird das hier der Hauptanlaufpunkt für halbwegs lesenswertes sein. Im Mittelpunkt steht auch diesmal wieder die Programmierung mit dem Schwerpunkt auf Sprachdesign.

                Allen Lesern (Maximale Menge dürfte so bei 2^1 liegen) auf jeden Fall mehr oder weniger Spaß dabei!