Atlantic Provinces Library Association Lisa Goddard Memorial University Libraries May 2011

Size: px

Start display at page:

Download "Atlantic Provinces Library Association Lisa Goddard Memorial University Libraries May 2011"

Joy Cross
5 years ago
Views:

1 Are We Ready for the Digital Humanities? Atlantic Provinces Library Association Lisa Goddard Memorial University Libraries May 2011

2 What are the Digital Humanities? How can libraries support DH?

3 Humanities Philosophy, literature, religion, art, music, history and language. Core library users. Core print users.

4 Digital Humanities Opening up new knowledge and new ways of learning through the application of digital technologies to any humanities subject. DH is about creating digital toolsets that allow users to undertake new forms of research in the humanities. Growing interest and investment.

5 George Mason: CHNM

6 Stanford Literary Lab

7 U Virginia Scholar s Lab

8 Digital Humanities in Canada U Alberta U Toronto U Victoria UNB U Montreal McMaster McGill York

9 Digital Humanities Projects

10 Thematic Digital Archives

11 Virtual Anthologies

12 Aggregate, Annotate, Review

13 GIS & Mapping

14 Clustering & Visualization

15 Text Transcription & Markup

16 Edition Comparisons

17 3D Sculpture Modeling

18 Tool Building

19 Anatomy of a DH Project Dunning et al, Freeing up digital content with text mining, Serials. 22(2), July 2009

20 Text Corpus 17 th C English news pamphlets Dec 1653 to May 1654 British Library electronic texts 312 documents, words

21 CLAWS: Part of Speech Tagging Grammar parsing tool (Linguistics) Identifies proper nouns, common nouns, plural nouns, adjectives, prepositions 95 97% accuracy

22 Geographical Analysis

23 Geographical Analysis

24 USAS: Semantic Parsing... two_n1 ships_m4 from_z5 Dunkirk_Z2 have_z5 brought_m2 Men_S2.2m Arms_B1,_PUNC and_z5 Ammunition_G3 to_z5 Middleton_Z1mf Ships = M4 (shipping, swimming, etc.) Men = S2.2m (People:-Male) Ammunition = G3 (warfare, defence and the army; weapons)

25 GIS Mapping: Topic War

26 GIS Mapping: Topic Money

27 DH Growing Pains

28 DH Library Fears The Humanists are leaving us for the Computer Scientists.

29 Digital Humanities Sources

30 Primary source materials

31 Primary source materials

32 Primary source materials

33 Primary source materials

34 Large text corpora

35 Large text corpora

36 Large text corpora

37 Large text corpora

38 Large text corpora Proposed settlement In-copyright works owned by universities Non-consumptive purposes One or two centres

39 Linguistic Corpora

40 Historical Linguistic Corpora

41 Historical GIS Data

42 Historical Census Datasets

43 Etext Preferences: Cost

44 Etext Preferences: Quality

45 Etext Preferences: Availability

46 Licensing & Rights Multi-layered sources with different licensing conditions. Copyright over annotations, data sets, other user-generated information. Need for clearly expressed rights info.

47 Copyright review project

48 Library Role: Sources Acquire & preserve primary sources Digitization & transcription Open, flexible formats Large text aggregations Data sets Licensing & copyright

49 Digital Humanities Metadata

50 Traditional Metadata Access to print collections Authorities Thesauri Bibliographies Indexes Concordances

51 Finding Aids: Primary Sources

52 Finding Aids: Data Sets

53 Name Authorities

54 Name Authorities

55 Specialized Thesauri

56 Full Text Markup Text Encoding Initiative (TEI)

57 Metadata: TEI <div n="castlist type="dramatispersonae" org="uniform" sample="complete"> <castlist> <head>dramatis Personae</head> <castitem type="role"> <role xml:id="wag">wagner</role> </castitem> </castlist> </div>

58 Metadata: TEI <sp who="wag"> <lb xml:id="l204"/> <p>for is he not <foreign xml:lang="la"> Corpus naturale </foreign>? </p> </sp>

59 Metadata: TEI <l xml:id="l26">nothing so sweet as <choice> <orig>magicke</orig> <reg>magic</reg> </choice> is to him;</l>

60 Metadata: TEI <metdecl pattern="((+ -)+\?/?)*"> <metsym value="trochee" terminal="false">+-</metsym> <metsym value="iamb" terminal="false">-+</metsym> <metsym value="spondee" terminal="false">++</metsym> <metsym value="pyrrhic" terminal="false">--</metsym> <metsym value="amphibrach" terminal="false">-+-</metsym> <metsym value="anapaest" terminal="false">--+</metsym> <metsym value="+">metrical prominence</metsym> <metsym value="-">metrical non-prominence</metsym> <metsym value=" ">foot boundary</metsym> <metsym value="/">metrical line boundary</metsym> </metdecl>

61 Metadata: TEI <l rend="font-size(100%) indent(5px)">both go</l> <l rend="font-size(100%) indent(-7px)">to law:</l> <l rend="font-size(100%) indent(-23px)"><hi rend="italic">i</hi> will</l> <l rend="font-size(100%) indent(- 26px)">prosecute</l> <l rend="font-size(90%) indent(-40px)"><hi rend="italic">you.</hi> </l>

62 Controlled Vocabularies

63 Controlled Vocabularies

64 Metadata: Library Role Metadata crosswalks Controlled vocabularies Thesauri & taxonomy Name authorities Text mark-up

65 Digital Humanities Preservation

66 Preservation: Library Role Storage infrastructure Digital objects & texts User generated annotations User generated data sets Software environments & tools Preservation metadata Long term access

67 Library Support for Digital Humanities Sources Licensing Digitization Metadata GIS & Data Sharing Preservation

68 Thank you. Lisa Goddard Scholarly Communications Librarian

State of the Art and Trends in Search Engine Technology. Gerhard Weikum

State of the Art and Trends in Search Engine Technology Gerhard Weikum (weikum@mpi-inf.mpg.de) Commercial Search Engines Web search Google, Yahoo, MSN simple queries, chaotic data, many results key is