Abstract
With the objective of providing easier access to pathology specimens, slides and kodachromes with linkage to x-ray and the remainder of the patient’s medical records, an automated natural language parsing routine, based on dictionary look-up, was written for Surgical Pathology document-pairs, each consisting of a Request for Examination (authored by clinicians) and its corresponding report (authored by pathologists). These documents were input to the system in free-text English without manual editing or coding. Two types of indices were prepared. The first was an »inverted« file, available for on-line retrieval, for display of the content of the document-pairs, frequency counts of cases or listing of cases in table format. Retrievable items are patient’s and specimen’s identification data, date of operation, name of clinician and pathologist, etc. The English content of the operative procedure, clinical findings and pathologic diagnoses can be retrieved through logical combination of key words. The second type of index was a catalog. Three catalog files — »operation«, »clinical«, and »pathology« — were prepared by alphabetization of lines formed by the rotation of phrases, headed by keywords. These keywords were automatically selected and standardized by the parsing routine and the phrases were extracted from each sentence of each input document. Over 2,500 document-pairs have been entered and are currently being utilized for purpose of medical education. Im Bestreben, einen besseren Zugriff zu pathologischem Untersuchungsmaterial, zu Diapositiven und Kodachromes zugleich mit verknüpfenden Hinweisen auf Röntgenaufnahmen und die übrige Krankengeschichte des Patienten zu ermöglichen, wurde eine automatisierte linguistische Klartextanalyse-Routine auf der Grundlage des Nachschlagens im Wörterbuch für Formblätter für bioptische Untersuchungen geschrieben. Bei den erwähnten Formblättern handelt es sich um ein Auftrags-Formblatt zur Durchführung einer Untersuchung (geschrieben vom Kliniker) und den entsprechenden Bericht des Pathologen. Diese Dokumente wurden in Klartext, d. h. ohne manuelle Überarbeitung oder Kodierung, in das System eingegeben. Zwei Arten von Indexen wurden erstellt: zunächst ein »inverted file« für das On-line-Retrieval, für die Wiedergabe des Inhalts der beiden Formblätter und für Häufigkeitszählungen von Fällen oder Fallauflistungen in Tabellenformat. Suchmerkmale sind dabei die Identifikationsdaten von Patienten und Operationsmaterial, das Datum der Operation, der Name des Klinikers bzw. des Pathologen usw. Die Art des operativen Eingriffs, des klinischen Befundes und der pathologischen Diagnosen können durch logische Kombination von Schlüsselwörtern aufgefunden werden. Der zweite Index-Typ waren Kataloge. Drei Kataloge, nämlich »Operation«, »Klinik« und »Pathologie« wurden im KWIC-Index-Verfahren mittels Rotation der Schlagwörter hergestellt. Diese Schlagwörter wurden automatisch ausgezogen und durch die linguistische Analyse standardisiert. Die entsprechenden Satzteile wurden aus jedem Satz jedes eingegebenen Dokuments herausgezogen. Mehr als 2500 Formblattpaare wurden verarbeitet und werden zur Zeit für Zwecke der medizinischen Ausbildung benutzt. *) This work is supported by the Norval Pierce Research Fund, Abraham Lincoln School of Medicine, University of Illinois, Chicago, Illinois. Publication Date: 09 February 2018 (online) Schattauer GmbH

This publication has 2 references indexed in Scilit: