Opracowanie przedmiotowe dokumentów
z zakresu nauk ścisłych: matematyczno-przyrodniczych i technicznych.
Język haseł przedmiotowych KABA:
teoria, praktyka, przyszłość
Kazimierz Dolny, 20-22 września 2006

Poprzedni - Spis treści - Następny

            

Veslava Osinska

Instytut Informacji Naukowej i Bibliologii UMK

wieo@umk.pl
http://www.umk.pl/~wieo

Współczesna problematyka sposobów klasyfikacji informatyki. Kierunki rozwoju
Contemporary Computer Science Classification. Challenges and Perspectives

Słowa kluczowe

Informatyka, nauki komputerowe, CCS, automaty klasyfikacji, ontologie, bazy wiedzy, sieci semantyczne

Keywords

Computing, Computer Science, ICT, Computing Classification System, Bibliomining, knowledge base, ontology, semantic networks

Abstrakt

Aktualne schematy klasyfikacyjne nauk komputerowych i technologii informacyjnej nie odwzorowują poprawnie ciągle zmieniających się semantyczno-statystycznych i predykcyjnych własności informatyki. System klasyfikacji Computing Classification System (CCS), zaimplementowany przez towarzystwo ACM, uważany jest na świecie za standard w identyfikacji i kategoryzacji literatury komputerowej oraz działalności badawczej w zakresie informatyki. Artykuł naświetla problemy związane z polską terminologią w systemach klasyfikacji w zestawieniu z ich światowymi odpowiednikami. W oparciu o historię rozwoju nauk komputerowych, zapotrzebowanie współczesnych użytkowników serwisów o profilu informatycznym oraz ontologiczne relacje, autorka analizuje, jakie mają być ergonomiczne systemy klasyfikacji informatyki.

Abstract

Existing Computer Science subject classification schemes do not meet semantic, statistic and perceptive challenges of information society. Innovative solution of classification scheme for computer literature called Computer Classification System (CCS) is applied by Association for Computing Machinery (ACM). To improve digital library classification systems of rapidly developing CS discipline they need to be dynamic, more homogeneous and ergonomic. The author analyzes both CS developing history and actual taxonomical needs of ICT services users.

 
 
 

Wstęp

Współczesne problemy wykorzystywania zasobów internetowych to głównie liczne braki w strukturyzacji niejednorodnych danych sieciowych, które prowadzą do powstawania trudności zarówno w wyszukiwaniu informacji relewantnych, jak i w niewystarczająco przejrzystej nawigacji serwisów informacyjnych. Próby usystematyzowania informacji w Internecie polegają obecnie na ujednoliceniu zestawów metadanych używanych w zakresie pojedynczej domeny wiedzy. Z właściwym użyciem metadanych wiąże się nadzieje i perspektywy funkcjonowania Internetu. Jednak sieciowe zasoby elektroniczne, opisywane za pomocą metadanych, to wciąż tylko nieznaczna część ogólnych zasobów.

Przez lata rewolucji informacyjnej ukształtowały się dwie klasyczne metody wyszukiwania informacji: kontekstowa i tematyczna. Użytkownicy preferują metodę pierwszą, kiedy na podstawie zapytania otrzymują od wyszukiwarki rankingową listę odpowiedzi. Nowoczesne wyszukiwarki są tak sprawne i prognozujące („odgadują” zainteresowania i preferencje użytkownika), że znajomość logiki i algebry Boole'a nie jest warunkiem skonstruowania efektywnego wyrażenia wyszukiwawczego. Druga metoda – wyszukiwanie katalogowe, jest typowym narzędziem biblioteczno-bibliograficznym. Zorganizowane w postaci wielopoziomowych drzew, katalogi i indeksy tematyczne najczęściej są wynikami/wskaźnikami erudycji i kreatywności redaktorów portali. Jak zauważa profesor Barbara Sosińska-Kalata w artykule o strukturach klasyfikacyjnych w Internecie[1], mimo że tradycyjne biblioteczne systemy klasyfikacyjne są wykorzystywane w katalogach OPAC[2], taki sposób dostępu do zasobów sieciowych przez niektórych specjalistów uważany jest za nieużyteczny i przestarzały ze względu na małą dynamiczność.

Dwoiste korzenie informatyki

Ewolucja niektórych szybko rozwijających się dyscyplin, szczególnie informatyki, wyprzedza istniejące taksonomie[3] w schematach klasyfikacyjnych. Taksonomie te są mocno zróżnicowane i niejednorodne, co można zauważyć w zestawieniu katalogów tematycznych naukowych i naukowo-popularnych serwisów sieciowych o tematyce komputerowej. Na przykład, jedne są wyspecjalizowane w typowo inżynieryjnej problematyce, inne mogą być przeznaczone dla zaciętych graczy komputerowych i prezentować działy poklasyfikowane w tym wąskim zakresie. Dlatego warto przyjrzeć się, jak jest zorganizowany i funkcjonuje system klasyfikacji, który jest światowym standardem w identyfikacji i kategoryzacji literatury komputerowej oraz działalności badawczej w zakresie informatyki.

Do klasyfikacji specjalizującej się w dziedzinie informatycznej należy system CCS (Computing Classification System), stworzony i rozwijany przez Stowarzyszenie na Rzecz Maszyn Obliczeniowych (Association for Computing Machinery, skrót ACM). Najstarsze z towarzystw informatycznych, które zostało założone w 1947 r., specjalizuje się w doskonaleniu wiedzy i umiejętności specjalistów i studentów technologii informatycznej z całego świata. W Polsce system ten także zyskał akceptację kręgów naukowych i władz uczelni.

Pierwotna wersja CCS została zaimplementowana w 1964 r., w latach 1982, 1983, 1987, 1991 i 1998 opublikowano kolejne uaktualnione wersje[4]. Do niedawna CCS nazywany był Computing Reviews Classification System (CRCS), ponieważ taksonomię zapożyczono od CRCS. Podobne znaczenie w klasyfikacji piśmiennictwa w zakresie fizyki pełni schemat PACS (Physics and Astronomy Clasification Scheme) używany w Physical Review od 1975 r., a w matematyce - MSC (Mathematical Subject Classification).

Skoro termin computing (należy koniecznie odróżniać go od innego terminu computation, co znaczy obliczenie) figuruje w nazwie klasyfikacji, warto przeanalizować, jak jest on interpretowany w środowisku naukowym i jak figuruje w tłumaczeniu na język polski? Ten imiesłów, wywodzący się bezpośrednio od computer i pierwotnie oznaczający działania wykonywane za pomocą maszyn liczących, po raz pierwszy użyty został przez Johna von Neumanna w 1945 r. w dokumentacji maszyny EDVAC[5] - dla określenia zautomatyzowanych systemów komputerowych (automatic computing system). Rozważając, czy informatyka powinna być uznana za dyscyplinę naukową, Peter J. Dening w swoim artykule[6] podaje, jak zmienia się naukowa identyfikacja informatyki w okresie jej historii, czyli ostatniego półwiecza. Do początku lat 90., a wtedy właśnie powstały pierwsze edycje CCS, termin computing był używany dla określenia wspólnego obszaru domen matematyki, nauk komputerowych oraz inżynierii. Obecnie, jak podkreśla P. J. Denning, nauki obliczeniowe (Computing Science), matematyka, inżynieria, grafika oraz ich wzajemne kombinacje łączone są w ramach bardziej nowoczesnego pojęcia: nauk komputerowych - NK (Computer Science). Europejskim synonimem NK (dawniej computing) jest termin informatyka (Informatics). Natomiast ogólna definicja informatyki pozostaje wciąż aktualna: zajmuje się ona procesami projektowania, konstrukcji, oceny, wykorzystania i konserwacji systemów zapamiętywania i przesyłania danych. Procesy te dotyczą sprzętu, oprogramowania, aspektów ludzkich i organizacyjnych. Zacytujmy tu prostą i przejrzystą definicję ze słownika informatycznego[7]: Informatyka – dziedzina nauki i techniki zajmująca się przetwarzaniem informacji – w tym technologiami przetwarzania informacji oraz technologiami wytwarzania systemów przetwarzających informacje. Ta dwoistość natury i zasięgu informatyki jest przedmiotem wieloletnich sporów naukowców, czy informatykę należy zakwalifikować jako samodzielną dyscyplinę naukową. Obok pytania, czym jest informatyka, bardziej – nauką, inżynierią czy technologią, Denning spekuluje, czy nie powinno się jej potraktować jako sztuki? Teza ta jest tym bardziej zasadna, iż programowanie, projektowanie, inżynieria sprzętu i oprogramowania powstawały i rozwijały się na bazie ludzkich idei, kreatywności oraz walorów estetycznych twórców. Sztuka komputerowa obecnie objawia się w zastosowaniach grafiki komputerowej, projektowania, ilustrowania, fotografii, animacji, muzyki, gier i rozrywki.

Informatyka w strukturach klasyfikacyjnych często pozycjonowana jest częściowo w naukach matematycznych i częściowo w naukach technicznych. Wynika to stąd, iż historycznie przyjęło się dzielić informatykę na teorię (wywodzącą się z matematyki) i praktykę (powiązaną z naukami technicznymi). Te dwa aspekty informatyki: obliczenia i maszyny liczące, matematyka i elektronika, software i hardware – funkcjonują nierozłącznie i nie sposób ustalić, który jest decydujący. Jak zaznacza profesor W. Duch w swojej książce, będącej źródłem gruntownej wiedzy na temat komputerów dla osób o rozmaitych zainteresowaniach[8], podział ten jest widoczny na uczelniach w sferach edukacji oraz badań naukowych. Informatyka teoretyczna wykładana na uniwersytetach związana jest z matematyką, natomiast informatyka techniczna uprawiana na politechnikach przechodzi w mikroelektronikę.

Próba opisu historycznego podziału informatyki zmusza do wyróżnienia głównych kierunków, które pomogły ludzkości we wszelkiego rodzaju aktywności obliczeniowej. A są to obliczenia, maszyny i dane, którym można przypisać bardziej precyzyjne kategorie odpowiednio: metody obliczeniowe, maszyny liczące, analiza danych. Zobaczmy zatem, czy wspomniana wcześniej klasyfikacja CCS trzyma się takiego historycznie wykształconego podziału.

Organizacja klasyfikacji CCS

Schemat klasyfikacji CCS w całości został zaczerpnięty z taksonomii nauk komputerowych i inżynierii opracowanej w 1980 r. przez Komitet Taksonomii AFIPS[9]. System ten jest zawarty w czteropoziomowym drzewie. Trzy pierwsze poziomy są numerowane i opisują zasadniczą strukturę dyscypliny, czwarty - określnik przedmiotowy, figurujący jako poziom nienumerowany, ma zapewnić procesy powstawania i rozbudowy nowych działów. Klasom głównym przyporządkowane są litery od A do K (11) – Tabela 1 poniżej[10]. Dwie z głównych klas dotyczą ściśle sprzętu i oprogramowania. Te dwa słowa pochodzenia obcego: hardware i software weszły w powszechne użycie na tyle, że nie drażnią już polskich purystów językowych.

Tab. 1. Klasy główne klasyfikacji CCS

A. Literatura Ogólna
B. Hardware
C. Zorganizowane systemy komputerowe
D. Software
E. Dane
F. Teoria obliczeń
G. Matematyczne metody obliczeń
H. Systemy informacyjne
I. Metodologie obliczeniowe
J. Zastosowanie komputerów
K. Środowisko obliczeniowe
A. General Literature
B. Hardware
C. Computer Systems Organization
D. Software
E. Data
F. Theory of Computation
G. Mathematics of Computing
H. Information Systems
I. Computing Methodologies
J. Computer Applications
K. Computing Milieux

Źródło: opracowanie własne

Kategorie sprzętu i oprogramowania są obecne w postaci podklas także w klasyfikacjach: Uniwersalnej Klasyfikacji Dziesiętnej (UKD) i Klasyfikacji Biblioteki Kongresu USA (LCC). W klasyfikacji LCC działy związane tematyką komputerową są „porozrzucane” po kilku głównych klasach. Na przykład „Inżynieria komputerowa i sprzęt” należy do klasy „T – Technologie”, a „Oprogramowanie” – do klasy „Q – Nauka”, podklasy „QA – Matematyka”. Uniknięcie takich „przeskoków” umożliwia klasyfikacja specjalistyczna, np. CCS. Przyjrzyjmy się zatem, jak wewnątrz pozostałych głównych klas klasyfikacji CCS zorganizowana jest tematyka dotycząca maszyn liczących oraz nowoczesnych technologii.

W klasie „C. Zorganizowane systemy komputerowe” dostępne są działy odnoszące się do architektury, projektowania sieci komputerowych oraz systemów rozproszonych. Ponadto są tu umieszczone informacje o architekturach procesorów równoległych, pojedynczych i mnogich strumieni danych (multiprocesorów) oraz o implementacji systemów komputerowych.

Odrębna klasa pod nazwą „E. Dane” poświęcona jest naukowym poszukiwaniom wydajnych sposobów przechowywania i przetwarzania danych. Udostępnia ona działy o strukturach, reprezentacjach, kodowaniu danych, a także teorię informacji, która powtarza się dalej w klasie H.

Kolejna klasa „H. Systemy informacyjne” obejmuje zagadnienia związane z przechowywaniem, zarządzeniem i wyszukiwaniem informacji oraz reprezentacją i zastosowaniem systemów informacyjnych. Kilka z podklas odnosi się bezpośrednio do aktualnych kierunków badań naukowych w zakresie bibliotek cyfrowych i sieciowych serwisów informacyjnych. Tematycznie zakres klasy pokrywa się ze współczesną problematyką informacji naukowej. W takim razie informacja naukowa istnieje jako główna klasa klasyfikacji CCS. Badanie procesów informacyjnych zachodzi z wykorzystaniem gotowych produktów informatycznych (np. oprogramowania, sieci, maszyn); liczne przykłady z życia zawodowego dowodzą, iż granica pomiędzy informatyką a informacją jest rozmyta. Nieprzypadkowo te dwie dziedziny: zarówno komputery, jak i informacja naukowa, są połączone w obrębie jednej z głównych klas 000 Klasyfikacji Dziesiętnej Dewey’a (KDD).

Jak na obecny stan rozwoju i zastosowania nauk komputerowych, niezbyt zrozumiałe jest kryterium grupowania kategorii w kolejnej klasie „I. Metodologie obliczeniowe”. Nazwa zdecydowanie niewystarczająco charakteryzuje i integruje wymienione tu kierunki badań i zawarte treści odnośników. Równolegle do podklasy „Sztuczna Inteligencja”-SI, figuruje „Grafika komputerowa”, „Symulacja i Modelowanie”, „Przetwarzanie dokumentów i tekstu”, „Rozpoznawanie obrazów” itp. Ostatnie dwie kategorie są typowe dla zagadnień informacji naukowej, stąd powstaje skrzyżowanie gałęzi poziomu drugiego klas: H i omawianej.

W ostatniej dekadzie wzrósł stopień zaawansowania badań w kierunku konstruowania maszyn inteligentnych, rozwoju robotyki, projektowania i implementacji systemów eksperckich, dzięki czemu sztuczna inteligencja wyrasta na samodzielną dziedzinę nauki stosowanej, będącą na styku informatyki, neurologii, psychologii i technologii. Wydaje się zatem, iż powinna jej być przydzielona osobna główna klasa klasyfikacji. Niektórzy badacze SI, np. John Kingston[11], wypowiadają się za stworzeniem samodzielnej klasyfikacji SI, która byłaby odseparowana od ogólnych zagadnień informatyki. Podkategorie klasy SI to: „Aplikacje i Systemy Eksperckie”, „Programowanie automatów”, „Dedukcja i dowody teoretyczne” (Theorem Proving), „Metody i formalizmy reprezentacji wiedzy”, „Języki programowania i oprogramowanie”, „Uczenie się”, „Przetwarzanie języków naturalnych”, „Wyszukiwanie i metody kontroli”, „Robotyka”, „Systemy Percepcji Wizualnych” (Vision and Scene Understanding), „Rozproszona Sztuczna Inteligencja”.

W klasie „F. Teoria obliczeń” mieszczą się odsyłacze do zagadnień informatyki teoretycznej: generowanie formalnych, matematycznych modeli komputera i obliczeń, logika matematyczna i języki formalne, a także badania logiki i wartości intelektualnej programów komputerowych. Pokrewna tematyka z zakresu zastosowań matematyki w informatyce zawarta jest w sąsiedniej klasie „G. Matematyczne metody obliczeń”: obejmuje ona analizę numeryczną, teorię grafów, teorię prawdopodobieństwa i statystykę oraz oprogramowanie służące wymienionym zagadnieniom. Nauki przyrodnicze, medyczne i ich pochodne, a także wszystkie dziedziny wykorzystujące metody komputerowe należą do klasy zastosowań informatyki: „J. Zastosowanie komputerów”. Tematykę związaną z historią komputerów i obliczeń, edukacją informatyczną, ale również poruszającą aktualne aspekty społeczne i etyczne informatyki zrzesza klasa ostatnia: „K. Środowisko obliczeniowe”.

Historyczny podział informatyki w logicznym systemie CCS

Przyjrzyjmy się, jak zorganizowana jest treść materiału w czwartej edycji Encyklopedii nauk komputerowych (Encyclopedia od Computer Science) z 2000 r. – niekwestionowanego w dzisiejszych czasach autorytetu w literaturze komputerowej i technicznej. Książka mieści zwięzłe objaśnienia najnowszych technologii informatycznych wraz z przykładami ich zastosowania w praktyce. Naświetlone są tu również historyczne motywy pojawienia się przełomowego punktu w rozwoju nauk komputerowych i technologii. Poruszanie bogatego zestawu zagadnień: perspektywy historyczne, aktualna wiedza i przewidywane trendy w bliskiej przyszłości lokuje encyklopedię na półce klasyki referencji naukowych. Rozdziały encyklopedii są pogrupowane następująco (p. Rys. 1):

Łatwo tu jest zauważyć bliską analogię do organizacji klas głównych klasyfikacji CCS. W konstrukcji taksonomii NK od wielu lat bierze udział ten sam skład osób (głównym redaktorem encyklopedii jest Anthony Ralston, który także tworzył wspólnie z innymi Taksonomię NK i Inżynierii) – widzimy tu konsekwentne trzymanie się zasady historycznej ciągłości w konstruowaniu schematu. Przedstawiony powyżej podział dla nauk komputerowych jest niemalże identyczny jak dekadę wcześniej powstały CCS. Nazwy większości klas (oprócz Hardware, Software i Teoria obliczeń) zmieniono na bardziej ogólnikowe i przejrzyste, dwie klasy o krzyżujących się gałęziach „Systemy Informacyjne” i „Dane” zostały połączone w jeden dział pod nazwą: „Informacja i Dane”.

Rys. 1. Organizacja rozdziałów w Encyklopedii Nauk Komputerowych

Źródło: opracowanie własne

Rozważania na temat rozwoju historycznego procesów obliczeniowych oraz współpracy człowieka z komputerem wymuszają pytanie o możliwości dalszej klasyfikacji zaprezentowanego podziału. Za cel postawimy sobie zadanie pogrupowania dziewięciu działów na wyższym poziomie. Wykorzystamy tu trzy wspomniane wcześniej grupy: maszyny, dane i obliczenia. Pierwsze trzy kategorie można byłoby przypisać do grupy maszyny, kategoria „Informacja i Dane” odnosiłaby się do grupy dane oraz do grupy obliczenia zaliczymy matematyczne metody w informatyce oraz informatykę teoretyczną (p. Rys. 1). Za pomocą pozostałych trzech kategorii: Metodologie, Zastosowanie i Środowisko wyszczególnione są możliwości zastosowań technologii komputerowych w różnych obszarach życia człowieka. Na dzień dzisiejszy utrwaliły się najważniejsze kierunki: sztuczna inteligencja, technologie Data Mining[12] i rozpoznawania obrazów, symulacja i modelowanie, grafika komputerowa, technologie informatyczne w przemyśle, medycynie, naukach ścisłych, kognitywnych oraz społecznych; oraz również bardzo ważna w społeczeństwie informacyjnym szybko rozwijająca się sfera edukacji informacyjno-informatycznej. Wszystko to są to rezultaty zarówno zespolenia różnych stref ludzkiej działalności naukowej i informacyjno-informatycznej, tak i interakcji pomiędzy człowiekiem a komputerem. W ostatnich latach ugruntowana została pozycja nowoczesnego interdyscyplinarnego przedmiotu „Interakcja człowiek – komputer” (Human-Computer Interaction HCI – brzmienie nawołuje do używania akronimu chińskiej litery XX CHI), który bada sposoby oddziaływania ludzkich procesów informacyjnych z procesami zautomatyzowanymi.

Dokonano próby rozpoznania wspólnych grup podziału logistyczno-empirycznego w zakresie informatyki, z uwzględnieniem historii przedmiotu. Moim zdaniem, takie lub podobne grupowanie może odgórnie zabezpieczyć braki w rzetelnej i szybkiej aktualizacji klasyfikacji nauk komputerowych, które przecież bardzo dynamicznie się rozwijają, a jednocześnie zachować główną strukturę drzewa klasyfikacji.

Pobieżne zapoznanie się ze współczesnymi tendencjami rozrostu gałęzi drzew klasyfikacji informatyki daje przegląd katalogów tematycznych ogólnodostępnych serwisów informacyjnych wyspecjalizowanych w dziedzinie nauk komputerowych i technologii. To preferencje użytkowników takich serwisów w dużej mierze decydują, które kategorie i podkategorie mają być bardziej rozbudowane, a które usunięte jako nieużyteczne. Można przypuszczać, iż różnorodność używanych schematów jest proporcjonalna do ilości rozpatrywanych serwisów - taką mieszaninę klasycznych i amatorskich klasyfikacji obserwujemy właśnie dzisiaj. Mimo że redaktorzy niektórych serwisów w trosce o ich aktualność na rynku informacji starają się stosować częste zmiany w strukturze (indeksacja z częstotliwością raz na tydzień), racjonalne rozwiązanie opiera się na technikach klasyfikacji automatycznej.

Strategie automatycznej klasyfikacji literatury informatycznej

W nowoczesnych strategiach klasyfikacji automatycznej, która odzwierciadlałaby aktualny stan rozwoju nauk, panują dwa główne nurty: metody statystyczne oraz oparte na zarządzaniu wiedzą. Pierwszy jest przeznaczony do klasyfikowania dużych zasobów dokumentów i wykorzystuje automatyczne algorytmy kategoryzacji i klasteryzacji[13] tekstu. W algorytmach określa się wektor/wektory/mapę cech zbioru obiektów. W zależności od koncepcji badaczy, mogą nimi być słowa kluczowe, odległość pomiędzy wyrazami, sekwencje słów, semantyczne podobieństwa i relacje, hierarchia elementów, występowanie spójników, elementy graficzne z otaczającym tekstem, topologia obiektów, formaty i rozmiary plików.

Drugi nurt związany jest z technikami zarządzania wiedzą (knowledge-based) w bazach wiedzy i modulowaniu sieci semantycznych. Inżynieria wiedzy wymaga zazwyczaj ręcznego wkładu, co jest czasochłonne. Automatyzacja procesu klasyfikacji zachodzi na etapie populacji jej struktury danymi. Najlepsze wyniki, jak dotychczas, uzyskano w granicach wąskich domen[14]. W inżynierii wiedzy można spotkać się z przybliżeniem modelowania wielo-perspektywicznego (Multi-Perspective Modelling)[11]. Według autorów, pojedyncze ontologie[15] nie są w stanie przekazać pełnego opisu badanego obiektu, a zatem kompletna reprezentacja pojęcia lub obiektu wymaga użycia co najmniej sześciu ontologii, zbudowanych według cech lingwistycznych przymiotów: kto, co, jak, gdzie, kiedy i dlaczego, które mogą powtarzać się na różnych poziomach abstrakcji.

Kingston w swojej pracy[11] szczegółowo analizuje możliwości zastosowania teorii przybliżenia wielo-perspektywicznego do struktury klasyfikacyjnej CCS ACM. Kategorie klasyfikacji odpowiadają trzem różnym poziomom abstrakcji (p. Tab. 2).

Tab. 2. Podstawowe klasy CCS według przybliżenia wieloperspektywicznego

 CoJakDlaczegoKiedyGdzieKto
Zastosowania komputeraZastosowaniaMetodologie Komputerowe    
Wnętrze komputeraHardwareSystemy Komputerowe    
 SoftwareDane    
  Systemy Informacyjne    
Poziom teoretyczny Teoria obliczeń, Matematyczne metody obliczeń    

Źródło: Kingston, J. Ontology, Knowledge Management, Knowledge Engineering and the ACM Classification Scheme[11]

Niektóre dotyczą samego komputera oraz jego „wnętrza” (hardware, software, organizacja systemów komputerowych, dane, systemy informacyjne), inne komputer traktują jako samodzielne pojęcie w kontekście aplikacji obliczeniowych (metodologie obliczeniowe, aplikacje komputerowe, środowisko obliczeniowe). Trzeci poziom objawia się w dwóch teoretycznych kategoriach: „Teoria obliczeń” oraz „Matematyczne metody obliczeń”. Jest to kolejny przykład strukturyzacji klas klasyfikacji CCS, która tym razem opiera się na ontologii o przybliżeniu wielo-perspektywicznym.

Podsumowanie

Podejście ontologiczne w klasyfikacji licznych zbiorów dokumentów jest kluczem do modelowania sieci semantycznych. Dobrym rodzajem klasyfikacji dzisiaj jest taka, która odpowiada nie tylko bibliotekarzom – specjalistom danej dziedziny, lecz również zadowala stopniem aktualizacji, szybkością działania, ergonomicznym interfejsem użytkowników serwisów informacyjnych. Niezbędna w tym celu jest kombinacja omówionych powyżej i sprawdzonych metod klasyfikacji w połączeniu z mechanizmem zapewniającym dobrą interakcję z użytkownikiem. W obliczu szybko zachodzących zmian w strukturze, a w szczególności w hierarchicznych powiązaniach działów nauk komputerowych i im pokrewnych należy przede wszystkim kłaść nacisk na efektywne generowanie i aktualizowanie takiej struktury. Przydatny jest również mechanizm symulacyjny, pozwalający na automatyczną predykcję rozrostu poszczególnych gałęzi klasyfikacyjnych oraz automatyczne uzupełnianie poszczególnych pozycji w drzewie katalogowym.

Autorzy systemu CCS i osoby (mogą to być kompetentni użytkownicy serwisu) biorące udział w jego aktualizacji przy opracowaniu zmian doceniają znaczenie historycznych ciągłości zarówno w procesach wyszukiwania informacji, tak i dla poprawnego funkcjonowania obecnego oprogramowania. Każde unowocześnienie struktury wymaga włączenia elementów mapowania z zachowaniem archiwalnej integralności oraz ergonomiczności; struktura taka jednocześnie powinna być przejrzysta dla przeciętnego użytkownika przeszukującego zasoby. W raporcie Komitetu Aktualizacji CCS z 1998 r.[16] przytoczono wizję przyszłego systemu CCS na 2018 r. Ma być to dynamiczny system odzwierciedlający rzeczywistość przyszłych lat. Ma wykorzystywać porady systemów eksperckich dotyczące każdego przekroju branży NK, a także opierać się na technikach automatyzacji (np. statystyczna analiza kontekstu aktualnej literatury) możliwych zmian.

Przypisy:

[1] SOSIŃSKA-KALATA, B. Struktury klasyfikacyjne w organizacji zasobów informacyjnych Internetu. In MISSI 2002: III Krajowa Konferencja – Multimedialne i sieciowe systemy informacyjne [on-line]. 2002 [dostęp 5 czerwca 2006]. Dostępny w World Wide Web: http://www.zsi.pwr.wroc.pl/zsi/missi2002/pdf/s403.pdf

[2] Katalog OPAC (Online Public Access Catalog) umożliwia szybkie i wielostronne wyszukiwanie różnego typu informacji.

[3] Tu jako porządek, systematyka klasyfikowanych obiektów z uwzględnieniem ich relacji.

[4] ACM Computing Classification System [on-line]. 1998 [dostęp 5 czerwca 2006]. Dostępny w World Wide Web: http://www.acm.org/class/1998/ccs98-intro.html.

[5] EDVAC (Electronic Discrete Variable Automatic Computer), kolejna wersja po ENIAC komputera elektronicznego, zbudowanego w kwietniu 1952 r.

[6] DENNIG, P. Is computer science science? In Comuncation of the ATM [on-line]. 2005 nr 4 (48) [dostęp 11 maja 2006]. Dostępny w World Wide Web: http://cs.gmu.edu/cne/pjd/PUBS/CACMcols/cacmApr05.pdf.

[7] ILLG, J., ILLG, T. Słownik informatyczny angielsko-polski polsko-angielski. Katowice: Wydaw. Videograf II, 2003. ISBN 83-7183-266-4.

[8] DUCH, W. Fascynujący świat komputerów. Poznań: Wydaw. NAKOM, 1997, s. 25-57. ISBN 83-86969-09-1

[9] AFIPS skrót od American Federation of Information Processing Societes, co oznacza amerykańskie stowarzyszenie zajmujące się problematyką przetwarzania informacji.

[10] Drzewo klasyfikacji dostępne jest na stronie portalu ACM: http://www.acm.org/class/1998/overview.html.

[11] KINGSTON, J. Ontology, Knowledge Management, Knowledge Engineering and the ACM Classification Scheme. In Proceedings of ES’02, the 22nd Annual International Conference of the British Computer Society's Specialist Group on Artificial Intelligenc, Cambridge, 10-12 December 2002 [on-line]. 2002 [ dostęp 20 kwietnia 2006]. Dostępny w World Wide Web: http://www.inf.ed.ac.uk/publications/online/0169.pdf.

[12] Data Mining (w tłumaczeniu „kopanie danych”) – eksploracja, drążenie danych, jest procesem mającym na celu odkrywania nieznanej dotąd wiedzy, jak na przykład wzorów zachowań, zależności między zdarzeniami.

[13] Klaster – grupa (klasa) obiektów, które są do siebie podobne pod względem pewnych cech. Klasteryzacja jest jednym z podstawowych zadań Data Mining.

[14] MALY, K., ZUBAIR, M., ANAN, H. An Automated Classification System and Associated Digital Library Services [on-line], July 2001 [dostęp 27 czerwca 2006 ]. Dostępny World Wide Web: http://www.cs.odu.edu/~anan/publications/nddl.doc.

[15] Ontologia jako sposób formalizacji wiedzy określa strukturę i schemat klasyfikacyjny bazy wiedzy.

[16] Computing Classification System 1998: Current Status and Future Maintenance. Report of the CCS Update Committee. 1998. In Computing Reviews [on-line]. January 1998 [dostęp 20 czerwca 2006]. Dostępny World Wide Web: http://www.acm.org/class/1998/ccsup.pdf.

            

Poprzedni - Spis treści - Następny

(C) 2006 EBIB

            Współczesna problematyka sposobów klasyfikacji informatyki. Kierunki rozwoju / Veslava Osinska // W: Opracowanie przedmiotowe dokumentów z zakresu nauk ścisłych: matematyczno-przyrodniczych i technicznych. Język haseł przedmiotowych KABA: teoria, praktyka, przyszłość. Kazimierz Dolny, 20-22 września 2006 roku. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich, K[omisja] W[ydawnictw] E[lektronicznych], Redakcja "Elektronicznej Biblioteki", 2006. - (EBIB Materiały konferencyjne nr 15). - ISBN 83-921757-6-X. -Tryb dostępu : http://www.ebib.info/publikacje/matkonf/kaba/osinska.php