Freitag, Juli 28, 2006

Lager-Thesis

Need to review this Thesis
and maybe corpus linguistics to a larger extent.

Mittwoch, Juli 26, 2006

Spielen

brand eins hat mir vor langer Zeit mal Spaß gemacht, doch seit Monaten denke ich daran, das Abonnement zu kündigen. Und nun: Eine fantastische Ausgabe über das Spielen.
Ich nehme mir nun vor, mir wieder mehr zu erlauben, weniger beschränkt zu sein, rotzfrech, wenn es sein muss, den Spaß am Tun zu suchen und den Zwang an der Arbeit sein zu lassen.
Wann waren wir das letzte Mal kreativ? Im Februar vielleicht?
Am meisten Spaß hatte ich früher, an Sonntagabenden, wo ich über die Zukunft sinniert und etliche EMails geschrieben hatte. An meinem Lieblingsplatz, mit Blick in Richtung Berge.
Claude Shannon, der auf dieser Seite bereits zitierte, ist jonglierend auf dem Einrad durch die Gänge seines Labors gefahren. Und hatte dabei die besten Ideen.
Morgen kauf ich mir ein Einrad. Vielleicht.

Mittwoch, Juli 19, 2006

Groovy

Groovy könnte mal meine früher geäußerten Java-Wünsche befriedigen helfen; Es führt immerhin Closures und dynamische Typisierung in Java ein und konvertiert nett aussehenden Script-Code in Java Bytecode.
Leider sind die Fehlermeldungen nicht gut. Das ist fatal. Arrays können noch nicht wie in Python gesliced werden. Außerdem fehlen mir noch Generatoren. Ich hoffe, Groovy wird erst released, wenn diese Probleme gelöst sind.
Außerdem stammen die Urheber aus der Web-Szene, nicht aus der Sprachverarbeitung. Das heißt, viele Ressourcen sind für die Entwicklung von Servlets, "GSP", "Grails", SQL-Anbindung etc. gebunden.
Trotzdem: sehr ähnlich zu Smalltalk, Python, Ruby etc., aber unter Verwendung der Java-Bibliotheken. Kann Spaß machen.

Sonntag, Juli 16, 2006

Zwei Zitate

"Il semble que la perfection soit atteinte non quand il n'y a plus rien à ajouter, mais quand il n'y a plus rien à retrancher ."
(
Perfektion ist erreicht, nicht dann, wenn man nichts mehr hinzufügen kann, sondern wenn man nichts mehr weglassen kann - Saint-Exupéry)
"Every technology goes through three stages: first a crudely simple and quite unsatisfactory gadget; second, an enormously complicated group of gadgets designed to overcome the shortcomings of the original and achieving thereby somewhat satisfactory performance through extremely complex compromise; third, a final proper design therefrom." (Robert A. Heinlein)

Donnerstag, Juli 13, 2006

Schlüsselqualifikationen

In der McKinsey-Umfrage zum Thema Berufseinstieg wird gefragt, in welchen der folgenden Bereiche man in der Universität qualifiziert worden wäre:
- Fachwissen
- Analytische Fähigkeiten
- Selbständiges Arbeiten
- Eigeninitiative
- Teamarbeit
- Führungsstärke
- Kommunikationsfähigkeit
Seltsam, dass die meisten dieser Qualifikationen in der Universität keine aktive Rolle spielen. Alles ist nur auf die Vermittlung von Fachwissen gemünzt. Dabei ist es sehr wahrscheinlich, dass man später in einem Bereich arbeitet, in dem ganz anderes Fachwissen benötigt wird.
Die Tatsache, dass u.U. auch Selbständiges Arbeiten und Eigeninitiative vermittelt wird, ist eher ein Unfall und resultiert aus der mangelnden Organisation der Universität. Noch nie hat ein Verantwortlicher die Vermittlung dieser Qualifikationen als Organisationsziel der Universität festgeschrieben. Traurig.

Microsoft Touts Office 2007 "Innovation" @ SYS-CON AUSTRALIA

ein Australischer Newsletter schreibt: "... Redmond is also directing part of its competitive strategy against Google and Yahoo throuth the "enterprise search" functionality in Office 2007, which boasts a services market opportunity of $2.1 billion worldwide, according to company research.

After announcing its enterprise search strategy in May, Microsoft is now saying that more than 35 partners have committed to delivering solutions to customers based on Microsoft’s search technologies, including BearingPoint Inc., FileNet Corp., Mondosoft A/S, Tata Consulting Services Ltd. and Wipro Ltd.

Within this strategy, Microsoft is introducing Quickstart for Microsoft Search, which the company says provides partners with an easy, low-cost way to obtain knowledge, build skills and win early customers with Microsoft search technologies. All Microsoft registered partners are eligible to participate. Partners need only their Microsoft partner ID to log onto the Quickstart for Microsoft Search extranet (http://www.quickstartmicrosoftsearch.com), and from there are given free access to training, community resources and an awards program. Microsoft expects to have hundreds of partner organizations participating in Quickstart as preparation for a Search Specialization that is planned to launch in 2007. ..."

Samstag, Juli 08, 2006

Newsweek - The 10 Most Dynamic Cities

München ist nach der Meinung eines Newsweek-Schreiberlings eine der 10 dynamischsten "kleinen" Städte. Der Artikel basiert rein auf dem Wachstum - während andere Städte in Deutschland schrumpfen, wächst München immerhin um 0.5% pro Jahr.
Nur schade, dass zeitgleich 55 ähnlich große Städte in China und 10
in Indien mindestens so schnell wachsen. Aber in keiner dieser Städte gibt es einen Augustiner Biergarten.

Donnerstag, Juli 06, 2006

Google baut Computer

Die New York Times schreibt einen langen Artikel darüber, wie Google seine Data Centers betreibt. Scheinbar bauen sie einen Großteil der Rechner selbst. Der Artikel enthält auch ein paar Bemerkungen zum Thema Google File System, Work Queue und MapReduce.

Dienstag, Juli 04, 2006

Lessons Learned from Claude Shannon

Für meine Leserin: Das Folgende hab ich seit drei Jahren an meinem Schreibtisch hängen. Und ich glaube, es stimmt.

Wie sollte man in unserem Bereich Research betreiben?
  • Go to the source (do original research - not explanations by others).
  • Follow curiosity in problem selection (avoid fads, avoid excessive perusal of journals).
  • Abstract a problem into essential features.
  • Be curious about real things.
  • Be curious about the conceptual puzzles in things.
  • After abstracting a problem, look at the simplest nontrivial version.
  • Knowing all theorems or all engineering practice is not necessary (and may be harmful)
Der komplette Text

Linguistische Suchmaschinen

1. Auf Textforge kann man Manatee und Bonito herunterladen, Server und Client eines Corpus Managers. Es unterstützt eine ganze Anzahl Query-Operationen, wie man hier sieht.
run(|s|ning)
\w+\.
[lemma="run"]
[lemma="be"] within <head>
"[0-9]+" within <head>
"[0-9]+"
[tag="AT.*"]
[tag="Y.*"]


2. Auf www.zeit.de wird eine linguistische Suchmaschine namens DDC verwendet, die unter GNU Lizenz verfügbar ist.
Features:
  • Satzbasierte (nicht dokumentenbasiert) Suche
  • Statistische Abfragen, keine Approximation
  • Suche nach Wortform, Lemma und POS-Tag
  • Suche in Chunks
  • Abstandssuche (gerichtet und symmetrisch)
  • Links- und Rechtstrunkierung
  • Not-Operator
  • Suche nach semantischen Kategorien
  • Metadatenfilter (definiert duch x-path-Ausdrücke)