05.41.20 T÷lvur og texti (semÝnarŠfingar 1)

Haustmisseri 1996

Kennari: EirÝkur R÷gnvaldsson, prˇfessor

HÚr mß finna řmislegt um gagnamßlfrŠ­i (corpus linguistics) ß vefnum.
HÚr er lÝka vÝsun Ý heimasÝ­u Text Encoding Initiative.
Nemendur eru sÚrstaklega hvattir til a­ sko­a nßmskei­ Catherine Ball um or­st÷­ulykla og textas÷fn.

TÝmi og sta­ur: Fimmtudaga kl. 815-1000 Ý stofu 309 Ý ┴rnagar­i.

Nßmskei­inu T÷lvur og texti er svo lřst Ý Kennsluskrß:

HÚr er ■vÝ ekki Štlunin a­ fjalla um hvers kyns hagnřtingu t÷lva vi­ mßlrannsˇknir, heldur einkum og sÚr Ý lagi hvernig t÷lvur au­velda e­a gera m÷gulega řmiss konar greiningu ß stˇrum textas÷fnum. Vi­fangsefni­ samsvarar sem sÚ a.n.l. ■vÝ sem nefnt er corpus linguistics ß ensku, og e.t.v. mŠtti ■ř­a sem gagnamßlfrŠ­i. HÚr ver­ur ■ˇ a­eins tŠpt ß hluta ■ess sem fellur undir ■a­ hugtak; t.d. ver­ur lÝti­ sem ekkert fjalla­ um t÷lfrŠ­ilega greiningu ß textas÷fnum, sem er verulegur ■ßttur Ý gagnamßlfrŠ­i.

┴hersla ver­ur l÷g­ ß sjßlfstŠ­a vinnu nemenda, og ver­a ■eim falin verkefni af řmsu tagi. B˙ast mß vi­ a­ nemendum ver­i fali­ a­ gera grein fyrir ni­urst÷­um sÝnum Ý tÝmum, og ■Šr ver­i sÝ­an rŠddar.

Nßmsmat er ˇßkve­i­, en kennara ■ykir e­lilegast a­ ■a­ felist Ý einhvers konar verkefni e­a verkefnum ß svi­i gagnamßlfrŠ­i. Ůetta ver­ur rŠtt nßnar Ý fyrstu tÝmum.

KennslubŠkur:

TvŠr bŠkur voru panta­ar fyrir nßmskei­i­, og ver­a lesnar nokkurn veginn Ý heild:

Anna­ lesefni ver­ur greinar og bˇkarkaflar sem dreift ver­ur Ý ljˇsriti e­a lßti­ liggja frammi ß lesstofu. Athugi­ a­ upptalning ß lesefni hÚr ß eftir er ekki tŠmandi, og kann a­ taka breytingum.

Lauslegt yfirlit um vi­fangsefni og lesefni:

1. vika (5. september)
Inngangur. Hagnřting t÷lva Ý mßlrannsˇknum.
Lesefni: Barnbrook 1996, 1. kafli; Gazdar & Mellish 1989, 1. kafli; Butler 1985, 3. kafli.

2. vika (12. september)
Textas÷fn og samsetning ■eirra. ═slensk textas÷fn.
Lesefni: Barnbrook 1996, 2. kafli; McEnery & Wilson 1996, 1. kafli, 2.1, 2.3-2.6; Renouf 1987; J÷rgen Pind, Fri­rik Magn˙sson og Stefßn Briem 1991, 3.1.

3. vika (19. september)
Forrit til textaleitar, or­tÝ­nirannsˇkna og or­st÷­ulyklager­ar.
Lesefni: Valdir kaflar ˙r handbˇkum me­ WordCruncher, Tact, Conc o.fl.

4. vika (26. september)
Merking texta. COCOA; SGML, TEI o.fl.
Lesefni: McEnery & Wilson 1996, 2.2; van Herwijnen 1994.

5. vika (3. oktˇber)
Or­tÝ­nikannanir og tÝ­niskrßr.
Lesefni: McEnery & Wilson 1996, 3. kafli; Barnbrook 1996, 3. kafli; Fri­rik Magn˙sson 1989; Baldur Jˇnsson 1975; Baldur Jˇnsson, Sven Ů. Sigur­sson og Bj÷rn Ellertsson 1980.

6. vika (10. oktˇber)
Or­st÷­ulyklar og ger­ ■eirra.
Lesefni: Barnbrook 1996, 4. kafli; Clear 1987.

7. vika (17. oktˇber)
═slenskir or­st÷­ulyklar.
Lesefni: EirÝkur R÷gnvaldsson 1990, 1995; Baldur Pßlsson 1990; BiblÝulykill 1994; ═slendinga s÷gur. Or­st÷­ulykill og texti 1996.

8. vika (24. oktˇber)
Hagnřting textasafna og or­st÷­ulykla til mßlrannsˇkna.
Lesefni: McEnery & Wilson 1996, 4. kafli; Barnbrook 1996, 5. kafli; Sinclair 1987a, b.

9. vika (31. oktˇber)
Setningagreining og textas÷fn.
Lesefni: Barnbrook 1996, 6. kafli; McEnery & Wilson 1996, 5. kafli.

10. vika (7. nˇvember)
Textas÷fn og s÷guleg setningafrŠ­i.
Lesefni: EirÝkur R÷gnvaldsson 1993a, 1993b, 1. kafli, 1994-95.

11. vika (14. nˇvember)
Hagnřting t÷lva vi­ texta˙tgßfur.
Lesefni: Sperberg-McQueen & Burnard (ritstj.) 1994, 18. og 19. kafli; Robinson 1994a, b.

12. vika (21. nˇvember)
T÷lvur, textas÷fn og or­abˇkager­.
Lesefni: Barnbrook 1996, 7.3; Moon 1987; Fox 1987; EirÝkur R÷gnvaldsson 1996.

13. vika (28. nˇvember)
Yfirlit. ┴stand og horfur.
Lesefni: McEnery & Wilson 1996, 7. kafli.

Rit sem vÝsa­ er Ý:

  1. Baldur Jˇnsson. 1975. TÝ­ni or­a Ý Hrei­rinu. Tilraunaverkefni Ý mßlt÷lvun. Rannsˇknastofnun Ý norrŠnum mßlvÝsindum, Hßskˇla ═slands, ReykjavÝk.
  2. Baldur Jˇnsson, Bj÷rn Ellertsson & Sven Ů. Sigur­sson. 1980. T÷lvuk÷nnun ß tÝ­ni or­a og stafa Ý Ýslenskum texta. RaunvÝsindastofnun Hßskˇlans, ReykjavÝk.
  3. Baldur Pßlsson. 1990. BiblÝan frß A til Í. BiblÝu■ř­ingar Ý s÷gu og samtÝ­. Studia theologica islandica 4. Gu­frŠ­istofnun Hßskˇla ═slands, ReykjavÝk.
  4. Barnbrook, Geoff. 1996. Language and Computers. A Practical Introduction to the Computer Analysis of Language. Edinburgh University Press, Edinburgh.
  5. BiblÝulykill. 1994. Or­alyklar a­ BiblÝunni 1981. BiblÝulykilsnefnd: Baldur Jˇnsson, Baldur Pßlsson, Gu­r˙n Kvaran, Jˇn Sveinbj÷rnsson, Svavar Sigmundsson. BiblÝulykilsnefnd og Hi­ Ýslenska BiblÝufÚlag, ReykjavÝk.
  6. Butler, Christopher. 1985. Computers in Linguistics. Blackwell, Oxford.
  7. Clear, Jeremy. 1987. Computing. Sinclair, John M. (ritstj.) 1987c, bls. 41-61.
  8. EirÝkur R÷gnvaldsson. 1990. Or­st÷­ulykill ═slendinga sagna. Skßldskaparmßl 1:54-61.
  9. EirÝkur R÷gnvaldsson. 1993a. Collocations and the Minimalist Framework. Lambda 18:107-118.
  10. EirÝkur R÷gnvaldsson. 1993b. SetningafrŠ­i fornra frßsagnartexta. Handrit, Hßskˇla ═slands, ReykjavÝk.
  11. EirÝkur R÷gnvaldsson. 1994-95. Breytileg or­ar÷­ Ý sagnli­. ═slenskt mßl 16-17:27-66.
  12. EirÝkur R÷gnvaldsson. 1995. A Concordance to Old Icelandic Texts and its Lexicographic value. Nordiske studier i leksikografi 3:123-135.
  13. EirÝkur R÷gnvaldsson. 1996. Brugen af et gammelislandsk tekstkorpus i leksikografisk arbejde. Sent til birtingar Ý LexicoNordica 3.
  14. Gazdar, Gerald, & Chris Mellish. 1989. Natural Language Processing in Prolog. An Introduction to Computational Linguistics. Addison-Wesley, Wokingham.
  15. Fri­rik Magn˙sson. 1989. Hva­ er tÝtt? TÝ­nik÷nnun Or­abˇkar Hßskˇlans. Or­ og tunga 1:1-49.
  16. van Herwijnen, Eric. 1994. Practical SGML. 2nd Edition. Kluwer, Boston.
  17. ═slendinga s÷gur. Or­st÷­ulykill og texti. 1996. Ritstjˇrar Or­st÷­ulykils: Bergljˇt S. Kristjßnsdˇttir, EirÝkur R÷gnvaldsson (a­alritstjˇri), Gu­r˙n Ingˇlfsdˇttir og Írnˇlfur Thorsson. Mßl og menning, ReykjavÝk.
  18. J÷rgen Pind (ritstj.), Fri­rik Magn˙sson & Stefßn Briem. 1991. ═slensk or­tÝ­nibˇk. Or­abˇk Hßskˇlans, ReykjavÝk.
  19. McEnery, Tony, & Andrew Wilson. 1996. Corpus Linguistics. Edinburgh University Press, Edinburgh.
  20. Moon, Rosamund. 1987. The Analysis of Meaning. Sinclair, John M. (ritstj.) 1987c, s. 86-103.
  21. Renouf, Antoinette. 1987. Corpus Development. Sinclair, John M. (ritstj.) 1987c, s. 1-40.
  22. Robinson, Peter. 1994a. The Transcription of Primary Textual Sources Using SGML. Office for Humanities Comunication Publications 6. Oxford.
  23. Robinson, Peter. 1994b. Collate 2: A User Guide. The Computers and Variant Texts Project. Oxford.
  24. Sinclair, John M. 1987a. Grammar in the Dictionary. Sinclair, John M. (ritstj.) 1987c, s. 104-115.
  25. Sinclair, John M. 1987b. The Nature of the Evidence. Sinclair, John M. (ritstj.) 1987c, s. 150-159.
  26. Sinclair, John M. (ritstj.). 1987c. Looking Up. An account of the COBUILD Project in lexical computing and the development of the Collins COBUILD English Language Dictionary. Collins, London.
  27. Sperberg-McQueen, C.M., & Lou Burnard. 1994. Guidelines for Text Encoding and Interchange. Chicago 1994.