Dienstag, Juli 04, 2006

Linguistische Suchmaschinen

1. Auf Textforge kann man Manatee und Bonito herunterladen, Server und Client eines Corpus Managers. Es unterstützt eine ganze Anzahl Query-Operationen, wie man hier sieht.
run(|s|ning)
\w+\.
[lemma="run"]
[lemma="be"] within <head>
"[0-9]+" within <head>
"[0-9]+"
[tag="AT.*"]
[tag="Y.*"]


2. Auf www.zeit.de wird eine linguistische Suchmaschine namens DDC verwendet, die unter GNU Lizenz verfügbar ist.
Features:
  • Satzbasierte (nicht dokumentenbasiert) Suche
  • Statistische Abfragen, keine Approximation
  • Suche nach Wortform, Lemma und POS-Tag
  • Suche in Chunks
  • Abstandssuche (gerichtet und symmetrisch)
  • Links- und Rechtstrunkierung
  • Not-Operator
  • Suche nach semantischen Kategorien
  • Metadatenfilter (definiert duch x-path-Ausdrücke)

2 Comments:

Blogger Ola said...

The Linguist's Search Engine:
http://lse.umiacs.umd.edu:8080/

Sehr interessant finde ich 'Query by Example' Feature ('find sentences with similar structure)

12:03 AM  
Blogger Ola said...

Einstein (1940):
Science is the attempt to make the chaotic diversity of our sense-experience correspond to a logically uniform system of thought [in which] experience must be correlated with the theoretical structure… What we call physics comprises that group of natural sciences which base their concepts on measurements…

Linguisten haben viel zu lange theoretische Strukturen entwickelt, ohne die Konzepte mit realen Daten zu konfrontieren. Sie haben das gemacht, nicht weil sie sich im Elfenbeinturm der Theorie einsperren wollten, sondern einfach nur deswegen, weil sie die richtigen Werkzeuge nicht hatten.

12:15 AM  

Kommentar veröffentlichen

<< Home