Gå til innhold

Søking på Internett!


Gjest Madam Felle

Anbefalte innlegg

Gjest Madam Felle

Hva er forskjellen på emnekatalog og fritekstsøk?

Oppgavelyden er:

1. Du skal ved hjelp av både emnekatalog og fritekstsøk finne og lagre 5 ulike Internett sider som kan brukes i prosjektet.

(Human-Etisk Forbund, Fridtjof Nansen, humanisme, Kristian Horn, Lars Gunnar Lingås, Lars Gule, selvbestemmelse, humanetikk.)

Lenke til kommentar
Del på andre sider

Fortsetter under...

Hva er forskjellen på emnekatalog og fritekstsøk?

Jeg går ut fra at de med fritekstsøk sikter til søkemaskiner (-robot / -spider). De kan også sikte til en helst spesiell søketjeneste på nettet. På universiteter og høyskoler har man tilgang til endel slike spesialiserte tjenester, for eksempel søk i en biblioteksdatabaser og slikt.

Det er jo en forskjell på søkemaskiner og emnekataloger (også kalt emneindekser og på engels Directories).

På gode emneindekser som www.yahoo.com, og http://dmoz.org/ er stoffet som det vises til samlet inn av mennesker. Du har derfor da en kvalitativ og kategorisert inndeling av stoffet. Du kan her da finne fram til den delen av katalogen som dreier seg om ditt emne.

Søkemaskiner som

google.com

vivisimo.com

teoma.com

kartoo.com

... baserer seg på at såkalte roboter som går igjennom store deler av nettet og og indekserer sidene rent maskinmessig.

Siden det er norske søkeord du skal bruke, er det nok ikke så stort håp om at du kan finne så mye ved å bla deg fram i en internasjonal emnekatalog.

Du må vel helst finne en norsk emnekatalog.

Yahoo er forøvrig en kombinert emnekatalog og søkemaskin. Der den ikke finner treff i sin emnekatalog, gir den deg treff i googles søkemaskin

Se for eksempel:

Katalogsøk på Yahoo, som bare gir to treff.

Søkemaskinsøk via yahoo, som gir mange treff.

Lenke til kommentar
Del på andre sider

Emneindeksen DMOZ Open Directory Project er en meget god emneindeks.

Her er treffene på søkefrasen humanism på DMOZ emneindeks

Der finner du da følgende kategorier (emner, directories):

Society: Religion and Spirituality: Humanism (42 matches)

Society: Religion and Spirituality: Opposing Views: Humanism (9)

World: Svenska: Samhälle: Religion: Humanism

Regional: North America: Canada: Society and Culture: Religion: Humanism (2)

Regional: Europe: United Kingdom: Society and Culture: Religion: Humanism and Secularism (2)

Desverre ikke noen fra Norge. DMOZ baserer seg på frivillig engasjement. Så er det ingen fra Norge som har engasjert seg for å lage en oversikt på DMOZ over norsk websteder om Humanisme, Human-etisk forbund osv. Der har kansje noen i Human-etisk forbund en oppgave? :)

Lenke til kommentar
Del på andre sider

Kvasir er jo ei norsk katalogteneste. Går alltids an å prøva der òg.

Hehe. Nei jeg tenkte ikke på den. Bruker den ikke selv.

Lenke til kommentar
Del på andre sider

Her er et dokument jeg benyttet meg av, mens jeg gikk IKT-driftsfag.

Kanskje det kan hjelpe deg

Søk på Internett

Ulike kategorier informasjon

Det fins to kategorier av informasjonssøk på Internett avhengig av om informasjonen er fritt tilgjengelig eller lagt ut i form av en abonnementstjeneste. For den siste typen brukes spesialiserte søkeverktøy, og tjenesten koster ofte penger. Søk etter vitenskapelige rapporter er svært ofte basert på spesialiserte søkeverktøy. Slike søkemekanismer vil ikke bli behandlet i denne artikkelen.

Vi skal her begrense oss til å se nærmere på generelle søkemekanismer for søking i informasjon som er fritt tilgjengelig. På Internett fins forskjellige typer søkeverktøy basert på ulike metoder. Ved å kjenne til hvilken metode søkeverktøyene bygger på, vil vi ha bedre forutsetning for å velge riktig verktøy. Derved er det større sannsynlighet for at informasjons¬søket vårt gir et vellykket resultat.

Informasjonsrommet på Internett

De viktigste informasjonstjenestene på Internett er:

• World Wide Web består av HTML-dokumenter lagret på web-tjenere (web-servere) rundt omkring i verden

• FTP filoverføring direkte til din PC fra FTP-arkiver på FTP-tjenere rundt omkring i verden

• News (Usenet) diskusjonsgrupper lagret på News-tjenere

• Gopher for søking via hierarkiske menyer i informasjonsbaser (Gopher-arkiver)

• Telnet fjerninnlogging på serverne til store organisasjoner/bedrifter

(har ofte eget kommandospråk)

For brukerne fremtrer alle Internett-tjenerne av samme slag som et stort "informasjonsrom". Derfor snakker vi om Web-rommet, FTP-rommet, News-rommet osv, se figur ovenfor.

Søk i informasjonsrommet

Med dagens søkeverktøy kan man med ett søk f eks lete etter filnavn i alle åpne FTP-arkiver i hele verden (i hele FTP-rommet). Tilsvarende gjelder for de andre informa¬sjons¬rommene.

I FTP- og Gopher-rommet søkes det etter hhv filnavn og menybetegnelser. På Web søkes det også i selve teksten ikke bare på filnavn/menynavn.

Det fins også søke¬verktøy som til¬later søk i flere informasjonsrom samtidig.

F eks kan Alta Vista søke både på Web og i News-grupper.

Informasjonen vi finner på Internett er av høyst varierende kvalitet. Informasjon har ofte kort levetid, og er derfor uaktuell selv om den fortsatt fins lagret på Internett. Dessuten fins det mengder med bare tøys. I utgangspunktet har all informasjon samme status; det er ingen rangering etter kvalitet. Utfordringen blir derfor å sortere ut relevant informasjon med tilstrek¬kelig høy kvalitet.

Strukturen på World Wide Web

Det fins to hovedgrupper av søkesystemer på Web, nemlig emnekataloger og indeksbaser som kan sammenlignes med hhv innholdsfortegnelse og stikkordregister i en bok, se figurene:

1. Emnekataloger minner om innholdsfortegnelsen foran i en bok, hierarkisk oppbygd med emnegrupper og undergrupper. Kategoriene på øverste nivå og på nivåene under er representert ved hyperlenker. Man klikker seg nedover i hierarkiet og kommer til slutt til en rekke oppføringer (HTML-dokumenter).

Amerikanske Yahoo med over 25.000 forskjellige kategorier og norske Kvasir og er eksempler på to populære søkeverktøy innenfor denne gruppen. URL-adressene finner du på neste side.

http://www.yahoo.com/

http://kvasir.sol.no/

2. Indeksbaser minner om stikkordsregister (indeks) i en bok. Registrene bygges opp ved at søkeroboter (spesielle dataprogram kalt "crawlers") gjennomsøker webdokumenter og registrerer adressen til ord og uttrykk i en stor søkbar database som er indeksert. Derved kan oppslag på bestemte søkeord gjøres meget raskt. Alta Vista og Lycos er eksempler på populære søke¬maskiner.

http://www.altavista.com/

http://www.lycos.com/

Oversikt over søkemaskiner og emnekataloger

Søkemaskiner:

Navn URL Kommentar

Alta Vista www.altavista.com

Søkemaskin for Web og News

Deja www.deja.com

Søkeverktøy for diskusjonsgrupper

Hotbot www.hotbot.com

Kan søke både på Web og i diskusjonsgrupper

Infoseek www.infoseek.com

Basert på "naturlig språk" uten krav til syntaks

Excite www.excite.com

Begrepbasert søking

FTPSearch http://ftpsearch.ntnu.no

Raskt søkeverktøy for FTP lokalisert til NTNU i Trondheim

Emnekataloger:

Navn URL Kommentar

Yahoo! www.yahoo.com

Den mest komplette emnekatalogen

Yahoo! Norge www.no.yahoo.com

Norsk versjon av Yahoo

Kvasir http://kvasir.sol.no

Har sin styrke på norske og nordiske oppføringer

Stroud www.stroud.com

Innholdsrik katalog over klientprogramvare for Internett og i tillegg mange hjelpeprogrammer

WhoWhere www.whowhere.com

Katalog over e-postadresser

Four11 www.four11.com

Den mest omfattende katalog på Web over e-postadresser

Metaindekser:

Kombinerte søkeverktøy som opererer mot flere av de kjente søkemaskinene på en gang kalles metaindekser. Fra samme søkeside får brukeren anledning til å søke i mange kjente søkemaskiner som Alta Vista, Infoseek, DejaNews, Yahoo etc.

Search Com på adresse http://www.search.com/ er et eksempel på en metaindeks. Search Com har et vanlig søkefelt, og i tillegg et søkefelt der du kan velge hvilket søkeverktøy som skal benyttes i søket. Derved kan flere indeksbaser gjennomsøkes på en effektiv måte. Ulempen er at du ikke kan anvende avanserte søkefunksjoner.

Kataloger versus søkemaskiner

For å bygge opp emnekataloger kreves det mye "manuelt" arbeid. Slike kataloger kan derfor ikke favne all informasjon på Internett. Styrken til emnekatalogene er at søketreff ofte inne¬holder relevant og aktuell informasjon satt i sin rette sammenheng. Du finner altså informa¬sjon om emnet sammen med beslektet informasjon. Emnekatalogen Yahoo dekker mer enn én halv million websteder (web sites). Informasjon samles inn på to måter:

a) tips fra brukerne

B) vha søkeroboter som gjennomsøker websider og avgjør hvilke som kan være aktuelle å kategorisere (klassifisere), dessuten hvilke gamle sider som må tas ut av katalogen.

Indeksbasene vil bære preg av den metodikken som brukes for å bygge de opp. Søkerobotene ser ikke strukturen i informasjonen og gir derfor usammenhengende informasjon til indeks¬basen. Når vi benytter et robotbasert søkeverktøy oppgir vi et søkeord og får en rekke "treff" i retur. Disse websidene er vanligvis ikke en del av et større kunnskapstre der beslektede emner også finnes. Til gjengjeld dekker indeksbasen Alta Vista flere hundre millioner websider.

Viktig

Bruk av emnekataloger krever noe kunnskap om det aktuelle emnet for å vite hvilken kategori det tilhører. Ved bruk av søkemaskiner kan du starte med en spesifikk infor¬masjons¬bit, f eks et ord eller en frase, og bruke det til å finne mer, uten å vite noe om emnet.

Søkeroboter kan ikke bare finne og indeksere enkeltord, men også titler, overskrifter og hyperlenker idet slike elementer er formatert med spesielle HTML-koder ("tags"). Titler, overskrifter etc som finnes i webdokumenter antas å inneholde nøkkelinformasjon og er derfor spesielt viktige som søkeord i indeksbasen. Derfor kan titler, overskrifter og navn på hyperlenker tillegges større vekt enn vanlige enkeltord. Derved kan søketreff i indeksbasen rangeres. Avanserte søkeverktøy kan også lagre informasjon om hvilken rekkefølge ordene forekommer i, dvs om to ord står i nærheten av hverandre i dokumentet, setningsledd som naturlig hører sammen etc. Som eksempel kan nevnes søk etter webdokumenter hvor

Gro Harlem Brundtland omtales i forbindelse med Verdens helseorganisasjon (WHO).

Her er vi altså interessert i dokumenter hvor søkeordene "Gro Harlem Brundtland" og "WHO" forekommer i samme setning (eller i nærheten av hverandre).

Søkerobotene kan bruke flere uker på en rundtur på Web. Det er viktig å huske på hvis du er ute etter "fersk" informasjon. Alle "ferske" dokumenter vil ikke nødvendigvis være registrert i den indeksbasen du søker i. Ved søk etter nye dokumenter kan det derfor lønne seg å prøve ulike indeksbaser, eller gjenta søket ved en seinere anledning.

Søkerobotene har også som oppgave å fjerne indeksord som peker mot websider som er fjernet. På grunn av tregheten i dette systemet kan vi ofte oppleve at søketreff peker til sider som ikke lenger eksisterer.

Det er i dag meget høy vekst i antall HTML-dokumenter som publiseres på Web. Legg merke til at søkeverktøyet bare returnerer URL-adresser til HTML-dokumenter et eller annet sted på Internett. Man er ikke sikret at disse søketreffene har verdi. Derfor trengs det stadig mer avan¬serte søkesystemer for å gjenfinne relevant informasjon. Som brukere må vi bli flinkere til å sette opp hensiktsmessige søkestrenger.

Yahoo versus Alta Vista

Yahoo!

Flere av søkeverktøyene kombinerer både katalogtjeneste og søkemaskin. Yahoo, som i utgangspunktet er en katalogtjeneste hvor man "klikker seg nedover" i emnehierarkiet, tilbyr også søking. Vær oppmerksom på at Yahoo!-søk bare søker i kategoriene, titlene og kommen¬tarene etter oppføringer som matcher søkeordene dine. Med andre ord, et søk innenfor Yahoo sin informasjons¬base returnerer lenker til de kategoriene eller oppføringene som inneholder stoff om det aktuelle emnet. Hvis du ikke får treff på denne type søk, må du ikke fortvile. Yahoo har nemlig sin egen søkerobot, kalt Inktomi, som automatisk utfører et globalt fritekst¬søk. Inktomis database inneholder henvisning til millioner av websider.

Du kan lære grunnleggende om søk på Yahoo ved å aktivere Hjelp-knappen på Yahoo sin norske hjemmeside og deretter klikke på hyperlenken Søk på Yahoo!. Vil du lære mer om å bla på Yahoo, kan du klikke på lenken Bla på Yahoo!.

Ønsker du å lære mer inngående om hvordan et Yahoo-søk settes opp, kan du aktivere lenken Avansert på hjemmesiden og deretter klikke på lenken Søkehjelp. Du får i tillegg hjelp for avansert søkesyntaks ved å klikke på lenken Avansert søkesyntaks. Utdrag fra Yahoo sine hjelpe¬funksjoner er for øvrig samlet i dokumentet Yahoo Hjelp.doc. Nedenfor følger et lite utdrag fra Avansert søkesyntaks:

Kreving og nekting av søkeord Når du bruker en av de følgende operatorene vil du enten kreve eller nekte ord å forekomme i søkeresultatet.

+

Setter du et + foran et ord, krever du at ordet skal finnes i alle treffene i søkeresultatet.

sammenlign: kjøtt med kjøtt +krohn

-

Setter du et - foran et ord, krever du at ordet ikke skal finnes i noen av treffene i søkeresultatet.

sammenlign: python med python -monty

Søk i ulike deler av dokumentet Når du bruker en av de følgende operatorene foran et søkeord, begrenser du søket til en bestemt del av dokumentet.

t: - begrenser søket til dokumentets tittel

sammenlign: einar gerhardsen med t:einar gerhardsen

u: - begrenser søket til dokumentets URL

sammenlign: hydro med u:hydro

Frasesøk (" ") Når du setter anførselstegn rundt et sett av ord, begrenser du søket til dokumenter som matcher søkeordene i nøyaktig den rekkefølgen.

sammenlign: de syv søstre med "de syv østre"

Trunkering (*) Når du setter en * etter et ord, utvider du søket til alle ord med denne ordstammen.

sammenlign: politi med politi*

Kombinert syntaks Du kan kombinere alle søkefunksjonene så lenge syntaksen kombineres i riktig rekkefølge. Riktig rekkefølge for å kombinere syntaksen er den samme som operatorene er listet i på denne siden. Med andre ord +, -, t:, u:, "" og til sist *.

sammenlign: (riktig) +t:fotball -amerikansk med (feil) t:+fotball -amerikansk

Tidsbegrensning Du kan begrense søket ditt til dokumenter som er nyere enn en viss dato. Søkesyntaks for tidsbegrensning er ikke tilgjengelig. Denne funksjonen kan kun benyttes fra Valg-siden .

Presentasjon av søkeresultatet Du kan stille inn hvor mange treff du ønsker presentert på hver resultatside etter sammendragssiden (oppsettet av sammendragssiden er fastsatt på forhånd). Det finnes ingen søkesyntaks for å stille inn antall treff pr. side. Denne funksjonen kan kun benyttes fra Valg-siden .

Ulike søketreff i Yahoo

Yahoo-søket kan gi opptil fire ulike typer treff:

• Kategoritreff (Yahoo-kategorier som matcher søkeordene)

• Site-treff (webadresser katalogisert i Yahoo)

• Nyhetstreff (nyhetsoppføringer i Yahoo)

• Inktomi-treff (wbsider indeksert av søkeroboten Inktomi)

Reultatet av et Yahoo-søk gir deg ulike typer informasjon. Det første du får opp er en liste over relevante Yahoo-kategorier, fulgt av en liste over Yahoo-siter. Ved siden av Yahoo-kategoriene og oppføringene som matcher søkeordene, får du i tillegg Yahoo-kategoriene som opp¬føringene hører hjemme i. På den måten kan du velge om du vil gå direkte til adressene, eller navigere rundt i relevante Yahoo-kategorier (browse rundt) etter beslektet informasjon.

Alta Vista

Alta Vista, som i utgangspunktet er en rein søkemaskin, tilbyr også katalogtjeneste gjennom en samarbeidspartner, nemlig The open directory project på URL-adresse: http://dmoz.org/ Denne katalogen inneholder over 186.000 kategorier og inkluderer over 1,2 millioner websteder (Web sites).

Alta Vista opererer med to begreper i forbindelse med søk, nemlig Main Search og Advanced Search. Ved å aktivere lenken Help nederst på hjemmesida får du tilgang til en grundig inn¬føring i søketenikker i Alta Vista. Du vil finne mesteparten av hjelpestoffet i de to Word-dokumentene Altavista Main Search Tutorial.doc og Altavista Advanced Search Tutorial.doc.

Alta Vista har en nedtrekksmeny for språkvalg. Det betyr at du kan avgrense søket til å bare gjelde webdokumenter skrevet i et bestemt språk, f eks Norwegian. Dette valget er ikke det samme som å spesifisere domene i søkestrengen ved f eks å legge til domain:no. Det siste avgrenser søket til websteder lagret på servere i no-domenet.

Nedenfor finner du et utdrag fra hjelpeteksten for MAIN SEARCH:

What is a Phrase?

A phrase is a group of words or numbers linked together. Phrases are used when you want specific words or numbers to appear together in your results pages. If you want to find an exact phrase, use "quotation marks" around the phrase when you enter words in the search box.

Example 1: To find information on the latest Star Wars movie, type "Phantom Menace" in the search box.

You can also create phrases using punctuation or special characters such as dashes, underscore lines, commas, slashes, or dots.

Example 2: Try searching for 1-800-555-1212 instead of 1 800 555 1212. The dashes link the numbers together as a phrase.

Tips for Receiving More Precise Results

For more search tips, read the Advanced Search Tutorial.

1. Try natural language queries.

Type a phrase or a question such as "Where can I find a schedule for women's basketball?"

2. Use Exact phrases.

If you know an exact phrase, put the phrase in quotes, for example: "golden gate bridge".

3. Search for Web pages in a specific language.

Using the Language pull-down menu in the search box, you can find all the documents on the Web about a given topic, written only in the language you specify. This type of search excludes Web sites written in any other language.

NOTE: this feature is only available for web page searches.

Example: If you select the French in the language drop-down menu when searching for escargot, you will see pages written in French only and including the word escargot.

4. Use lowercase text in your searches. When you use lowercase text, the search service finds both uppercase and lowercase results. When you use uppercase text, the search service only finds uppercase results.

Example: When you search for california, you'll find California, california, and CALIFORNIA in your results pages. However, when you search for California, you'll only see California in the results pages.

5. Include or exclude words. To make sure that a word is always included in your search, place a plus sign (+) immediately before the keyword (no spaces) in the search box. To make sure that a word is always excluded from your search, place a minus sign (-) immediately before the keyword (no spaces) in the search box.

Example: To find recipes for chocolate cookies without chips, try recipe cookie +chocolate -chips.

6. Use wildcards. By typing an asterisk (*) at the end of a keyword, you can search for multiple forms of the word.

Example: Try big*, to find big, bigger, biggest, and bigwig.

7. Use special characters and punctuation.

AltaVista Search defines a word as any combination of letters and numbers that is separated by any of the following:

• White space, such as spaces, tabs, line ends, or the start or end of a document.

• Special characters and punctuation, such as %, $, /, #, and _.

AltaVista interprets punctuation as a separator for words. Placing punctuation or a special character between each word (with no spaces between the characters and the words) is another way to indicate a phrase. Example: Entering Jean-Luc Picard is easier than entering "Jean Luc" Picard, which is acceptable, but requires more keystrokes. Hyphenated words, such as x-files, are also considered phrases because of the hyphen.

You may decide only to use double quotes in your phrases to avoid confusion.

Fancy Features for Typical Searches

AltaVista searches more than just text. You can use special keywords to search for matches in such things as page titles or domains. The currently supported keywords are:

Keyword

Function

anchor:text Finds pages that contain the specified word or phrase in the text of a hyperlink. anchor:"Click here to visit garden.com" would find pages with "Click here to visit garden.com" as a link.

applet:class Finds pages that contain a specified Java applet. Use applet:morph to find pages using applets called morph.

domain:domainname Finds pages within the specified domain. Use domain:uk to find pages from the United Kingdom, or use domain:com to find pages from commercial sites.

host:name Finds pages on a specific computer. The search host:www.shopping.com would find pages on the Shopping.com computer, and host:dilbert.unitedmedia.com would find pages on the computer called dilbert at unitedmedia.com.

image:filename Finds pages with images having a specific filename. Use image:beaches to find pages with images called beaches.

link:URLtext Finds pages with a link to a page with the specified URL text. Use link:www.zip2.com to find all pages linking to Zip2.com.

text:text Finds pages that contain the specified text in any part of the page other than an image tag, link, or URL. The search text:graduation would find all pages with the term graduation in them.

title:text Finds pages that contain the specified word or phrase in the page title (which appears in the title bar of most browsers). The search title:sunset would find pages with sunset in the title.

url:text Finds pages with a specific word or phrase in the URL. Use url:zip2 to find all pages on all servers that have the word zip2 in the host name, path, or filename--the complete URL, in other words.

Begrepbasert søking

Det kan ofte være vanskelig å finne relevant informasjon ved å benytte indeksbaser. Utdrag fra en artikkel i magasinet Wired av Steve G. Steinberg (mai 1996) vil belyse problemet:

The "problem" of information retrieval can actually be nailed down to two issues: synonymy and homonymy. The first is a problem because a search for documents containing the word "film" won't find documents containing synonyms such as "movie". Homonyms, words that are spelled the same but have different meanings, are a problem because the search will find documents containing "a film of oil".

Det fins i dag søkeverktøy som kan slå opp synonymer og derved ekspandere søket til å gjelde alle synonymer. Derved oppstår en ny klasse indeksbaser, nemlig indeksbaser for begreps¬basert søking (en mellomting mellom emnekatalog og indeksbase). Slike søkeverktøy prøver også å finne ut hvilket emne eller begrep brukeren er ute etter ut fra inngitt søkeord. Målet er å finne det mest relevante dokumentet. Indeksbaser for begrepsbasert søking opererer med begreper og temaer i stedet for enkle stikkord. Ord som ofte opptrer i nærheten av hverandre i samme setning eller avsnitt, antas å høre sammen. F eks var navnet "Gro Harlem Brundtland" for en del år tilbake ofte knyttet til ordet "Arbeiderpartiet", "Stortinget", "statsminister", "Prime minister of Norway" m fl. I dag derimot er "Gro Harlem Brundtland" knyttet til ord som "FN", "WHO", "Verdenskommisjonen for miljø og utvikling" m fl. Ideen er at begrepsbaserte søkeverktøy skal fange opp denne endringen og forandre klassifiseringen slik at "Gro Harlem Brundtland" i dag opptrer under andre kategorien en tidligere.

Excite er en indeksbase som bruker begrepsbasert søkeverktøy. URL-adressen til Excite er: http://www.excite.com/

Enkle søk med søkemaskiner

Forklaring på bruk av logiske operatorer i avanserte søk finner du i Word-dokumentet: Altavista Advanced Search Tutorial.doc , eller på Alta Vista under temaet

Advanced Search Tutorial på adresse: http://doc.altavista.com/adv_search/ast_i_index.shtml For avanserte søk henvises det til disse kildene.

De forskjellige søkeverktøyene på Web bruker tilnærmet samme sett regler (samme syntaks) for innskriving av søkeord og søkestrenger. En søkestreng består av flere søkeord adskilt med mellomrom. Søkestrengen kan også inneholde sammensatte søkeord bestående av to eller flere ord omgitt av anførselstegn. Dette kalles en frase. "thor heyerdahl" er et eksempel på en frase.

Den enkleste form for søking er å skrive inn ett enkelt søkeord som deretter sendes over til indeksbasen (main search). Etter relativ kort tid returneres hyperlenker til en rekke webdokumenter som alle inne¬holder søkeordet.

Eksempel:

Hvis du foretar et søk i Alta Vista med søkeordet "kontiki"

og ikke avgrenser søket til norsk språk, vil du få flere tusen treff (søk foretatt

7. mars 2000 ga 2.771). Veldig få av disse doku¬mentene dreier seg om Kontiki-ferden til Thor Heyerdahl. Avgrenser du søket til å gjelde norsk språk, redu¬seres antall treff til 26, men få av disse doku¬¬mentene dreier seg om Kontiki-ferden.

Ved å oppgi både "kontiki" og "thor heyerdahl" i søke¬strengen uten språk¬avgrensning vil vi få enda flere treff, nemlig 5.910. Grunnen er at søkemaskinen først rangerer de dokumentene som inneholder begge søkeordene, dernest de dokumentene som bare inneholder ett av ordene.

Hvis vi ønsker informasjon om Kontiki-ferden, bør vi oppgi flere ord i søke¬strengen. For å avgrense søket kan vi bruke pluss-tegn foran de ordene som vi ønsker skal forekomme i dokumentene. F eks vil søkestrengen:

+kontiki +"thor heyerdahl"

bare gi 84 treff hvor de aller fleste dokumentene har med Kontiki-ferden å gjøre.

Hvis vi ønsker å få med engelske webdokumenter kan vi ta med et relevant engelsk ord i søkestrengen, f eks:

kontiki "thor heyerdahl" påskeøya "easter island"

Det er usannsynlig at begge ordene "påskeøya" og "easter island" forkommer i samme dokument. Fordi i det aktuelle søket ikke krever at alle søkeordene skal forekomme i webdokumentet, får vi likevel veldig mange treff , nemlig 22.762 (hvorav det første er hjemmesida til Easter Island). Utelukker vi "påskeøya" reduseres antallet til 22.717.

Tar vi ut det engelske navnet "easter island" synker antall treff radikalt til 5.957.

Hvis vi jakter på både norske og engelskspråklige dokumenter som inneholder hhv "påskeøya" eller "Easter Island" kan vi sette opp søkestrengen med OR (ELLER) mellom disse to søkeordene. Nedenfor vises et enkelt eksempel på bruk av parenteser og OR i søkestrengen:

(påskeøya OR "easter island")

Denne søkestrengen gir imidlertid et helt uhåndterlig antall treff, nemlig 1.186.984. For å avgrense søket må vi utvide søkestrengen med flere ord. Vi må dessuten hele tiden vurdere om vi skal bruke pluss-tegn foran enkelte av søkefrasene (søkeordene), eventuelt om vi skal bruke logisk AND (OG) mellom søkefraser.

Noen ganger ønsker vi ikke at webdokumentene skal inneholde bestemte ord. Det kan vi oppnå ved å sette minus-tegn foran det aktuelle ordet. Ønsker vi mest mulig informasjon om Thor Heyerdahl utenom selve Kontiki-ferden, kan vi bruke søkestrengen:

+"thor heyerdahl" -kontiki

som gir 3.139 treff.

Infoseek på adresse http://infoseek.go.com/ er et søkeverktøy basert på grense¬snittet "naturlig språk". Det innebærer at du kan skrive inn en vanlig setning uten krav til syntaks. For eksempel kan du skrive setningen:

Thor Heyerdals seilas med sivbåten Ra over Atlanterhavet

for å få treff på webdokumenter som omhandler Ra-ekspedisjonen. Dette søket gir imidlertid hele 6.466.11 treff, slik at det blir litt av en jobb å "sile" dokumenter. Men til trøst er antakeligvis de første på trefflista de mest relevante.

Søk-funksjonen

Noen ganger ønsker vi å finne ut hvor i dokumentet søkeordet finnes. Da kan vi bruke Find-funksjonen som finnes i alle nettlesere. I Explorer finner du den under menyvalgene:

RedigerSøk, eller hvis du bruker norsk programversjon: EditFind.

Rangering av søketreff

Hvis det søkes på et enkelt ord vil søkemaskinene alltid rangere trefflista i en bestemt rekkefølge med lenken til det mest relevante dokumentet først. Metodene som brukes for å rangere en treffliste vil variere fra søkemaskin til søkemaskin, men en del felles trekk går igjen. Mange søkemaskiner tildeler hvert treff en bestemt indeks som skal fortelle hvor relevant sida er i forhold til den aktuelle søkestrengen. Vanlig rangering av websidene kan foregå etter kriteriene:

• Antall ganger søkeordet finnes i dokumentet

• Om søkeordet forekommer tidlig i dokumentet

• Om ordet forekommer som tittel, overskrift eller som hyperlenke

• Hvor mange andre websider som har hyperlenker som peker til den aktuelle sida

Hvis søkestrengen består av flere ord (fraser), kan rangeringen forgå etter følgende kriterier:

• Webdokumenter som inneholder alle søkeordene kommer først

• For å rangere dokumenter som inneholder alle søkeordene prioriteres dokumenter hvor søkeordene står nær hverandre (innenfor samme avsnitt)

• Deretter kommer dokumenter som inneholder et av søkeordene, hvor dokumenter som inneholder det første søkeordet kommer foran de som inneholder det neste søkeordet

Ved bruk av fraser (eller hele setninger), f eks "Det norske Polarinstitutt" får alle websider, hvor hele frasen inngår, en høy relevansindeks, mens sider som bare inneholder deler av frasen får lavere indeks.

Effektiv søking

Blir antall treff for mange, vil du ikke rekke å se gjennom lista. Målet for de fleste søk blir derfor å sette opp en søkestreng som returnerer et overkommelig antall treff. Nedenfor gis en del generelle råd for å avgrense et søk:

• Unngå småord som produserer mange treff. Bruker du f eks ordet "data", vil du få enormt mange treff, men en slik treffliste vil være til liten hjelp. Kombiner derfor slike ord med andre, mer sjeldne ord.

• Hvis det er mulig, bruk fraser av typen "Det norske Nobelinstitutt" og lignende.

• Bruk plusstegn foran søkeord for å kreve at ordet skal være med i dokumentet. Tilsvarende kan du bruke minustegn for å kreve at ordet ikke skal være med i dokumentet.

• Avanserte søk kan settes opp ved å bruke logiske operatorer som AND, OR eller NOT i søkestrengen. Du kan også bruke operatorene NEAR og FOLLOWED BY for å sikre at søkeordene ligger nær hverandre i dokumentet.

• Legg merke til at bruk av logisk OR utvider antall treff betraktelig., vær derfor tilbakeholden med bruk av OR. Er du usikker på stavemåten av et ord, kan det være nyttig å bruke OR, f eks:

"Tor Heyerdal" OR "Thor Heyerdahl" OR "Thor Heyerdal" OR "Tor Heyerdahl"

• Et søk kan avgrenses til bestemte domener på Internett. F eks hvis du ønsker treff på dokumenter produsert i Storbritannia, kan du avgrense søket til uk-domenet. Er du ute etter bare norskproduserte dokumenter og bruker Alta Vista som søkemaskin, skrives dette domain:no.

• Ikke alle søkemaskiner utvider søket med synonymer, bruk derfor synonymer hvis du er usikker på hvordan søkemaskinen oppfører seg.

• Bruk flere søkemaskiner. Det gjelder spesielt hvis du er på jakt etter ny informasjon, idet det kan gå opptil flere uker mellom hver gang en søkemaskin er innom en web-tjener.

Eksempler på søkestrenger

Bruk Alta Vista og se på trefflista ved bruk av søkestrengene nedenfor. Forsøk å forklare hvorfor antall treff noen ganger varierer sterkt, mens andre ganger blir antall treff det samme for ulike søkestrenger.

de syv søstre

”de syv søstre”

cars bmw mercedes

cars OR bmw OR mercedes

+cars +bmw +mercedes

cars AND bmw AND mercedes

+cars +bmw –mercedes

cars AND bmw AND NOT mercedes

kontiki

Kontiki

Kon-Tiki

kontiki "Thor Heyerdahl"

kontiki "Thor Heyerdahl" påskeøya

kontiki "Thor Heyerdahl" +påskeøya

kontiki "Thor Heyerdahl" påskeøya "easter island"

kontiki +"Thor Heyerdahl" påskeøya +"easter island"

kontiki +"Thor Heyerdahl" påskeøya +"easter island" -"CD-ROM"

Nærmere beskrivelse av populære søkeverktøy

På hjemmesiden til Alta Vista finner du hyperlenker til hjelpefunksjoner. Beskrivelsen av søkeverktøyet er på engelsk.

Help http://doc.altavista.com/help/search/adv_help.shtml

Main Search http://doc.altavista.com/help/search/search_help.shtml

Advanced Search Tutorial http://doc.altavista.com/adv_search/ast_i_index.shtml

På Yahoo sin norske hjemmeside http://no.yahoo.com/ finner du beskrivelse av søkeverktøyet. Knappen Hjelp gir deg grunnleggende stoff om Yahoo. Ønsker du informasjon om avanserte søk, kan du aktivere hyperlenken Avansert. Adressene er gjengitt nedenfor:

Hjelp: http://no.docs.yahoo.com/info/howto/

Avansert: http://no.yahoo.com/r/bf

Søkehjelp: http://no.search.yahoo.com/search/no/help?

Avansert søkesyntaks: http://no.search.yahoo.com/search/no/syntax?

Lenke til kommentar
Del på andre sider

Annonse

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...