Previous Issue | List of Issues | TidBITS Home Page | Next Issue

TidBITS#336/15-Jul-96

Ondanks een hittegolf in Seattle, bevat de uitgave van deze week nieuws over updates van RAM Doubler en Retrospect, tezamen met details over de inhoud van het Microsoft Empowerment Pack, een artikel over Claris OfficeMail en een stuk over hoe search engines de opdracht te geven om Usenet berichten en web pagina's te negeren. Tevens bekijken we kort een aantal nieuwe en aangepaste programma's die van belang zijn voor Mac Webmasters: MacHTTP, WebSTAR, NetForms, Phantom, LogDoor en LogRoller.

Dit nummer van TidBITS werd gedeeltelijk gesponsord door: Copyright 1990-1996 Adam & Tonya Engst. Details aan het einde van deze editie.
Informatie: <[email protected]> Comments: <[email protected]>


Topics:

MailBITS/15-Jul-96

RAM Doubler 2 komt er aan -- Connectix heeft aangekondigd dat RAM Doubler nog voor de MacWorld Boston in augustus uitgebracht zal worden. Tezamen met andere veranderingen zal RAM Doubler 2 een regelpaneel-interface bieden, een snellere compressie engine en het gebruikers toestaan om de hoeveelheid geheugen die je Macintosh denkt beschikbaar te hebben te verdrievoudigen. Er zullen kortingen op RAM Doubler 2 gelden voor bestaande gebruikers en vrije upgrades voor diegenen die RAM Doubler recentelijk hebben aangeschaft. [GD]

<http://www.connectix.com/connect/RPM.html>

Retrospect 3.0A Updater -- Dantz heeft eindelijk de 3.0A update voor het populaire backup-programma Retrospect uitgebracht. De nieuwe versie voegt ondersteuning voor Windows Remotes toe, zodat je nu Windows machines op je netwerk kunt backuppen door middel van Retrospect. Omdat deze machines waarschijnlijk geen AppleTalk hebben, gebruikt Retrospect 3.0A TCP/IP en Open Transport om met deze machines te communiceren. De nieuwe versie voegt een aantal specifieke features toe, zoals ondersteuning voor oudere Sony DAT drives em de mogelijkheid om 8 mm Exabyte tapes te formatteren. De update corrigeert ook problemen zoals problemen die te maken hebben met het RAM; betere ondersteuning voor Arabische, Hebreeuwse en Chinese karaktersets en een oplossing om alias volumes op Novell servers te zien. Gebruikers van RAM Doubler moeten weten dat 3.0A de compatibiliteit met dit programma verbetert, en dat Dantz aanbeveelt dat je versie 1.6.2 of later tezamen met Systeem 7.5.3 gebruikt. Je kunt de updater file (1,6 MB) downloaden vanaf de Web of FTP site van Dantz, maar houd er rekening mee dat deze sites op dit moment behoorlijk druk kunnen zijn. [ACE]

<http://www.dantz.com/retro_30A_updater.html>
<ftp://ftp.dantz.com/pub/updates/Retrospect_30A_Updater.sit.hqx>

Web Updates en Utilities

door Adam C. Engst <[email protected]>

Tegelijk met de Mactivity-bijeenkomst, die deze week plaats heeft, is er heel wat activiteit geweest in de Macintosh-wereld wat betreft het Web. Hier volgen enkele van de eerste aankondigingen met tevens wat nieuws over veiligheid in MacHTTP en WebSTAR. Lees de nieuwe produkt-aankondigingen van volgende week, nadat wij de gelegenheid hebben gehad alle persmededelingen, aankondigingen en mond-tot-mond-berichten na te gaan over het interessant materiaal.

MacHTTP Noodzakelijke Update -- Chuck Shotton , schrijver van het shareware-programma MacHTTP en zijn commerciële versie, heeft net geproduceerd wat hij noemt "een belangrijke, noodzakelijke update". Dit om mogelijke veiligheidsproblemen op te lossen voor MacHTTP 2.2 en vroegere versies. In sommige uitzonderlijke gevallen zou dit probleem kunnen leiden tot geweigerde toegang tot files op de server. Als je een vroegere versie gebruikt van MacHTTP of WebSTAR PS (de versie van MacHTTP die werd verdeeld met het WebMaster Max boek) moet je het volledige MacHTTP 2.2 programma afhalen van de Web site van StarNine en het dan updaten met de patch.

<http://www.starnine.com/machttp/machttpsoft.html/>

WebSTAR Updated -- Tegelijk met de update van MacHTTP lanceert StarNine tevens WebSTAR 1.3.1, een kleine correctie aan de juist vrijgelaten WebSTAR 1.3 (wat custom plug-ins ondersteunt voor verbeterde prestaties over gelijkaardige CGI's). Het blijkt dat Chuck Chotton een custom-URL had bijgevoegd bij MacHTTP om de copyright- informatie te tonen op aanvraag van advocaten, en hij breidde de resultaten van deze custom URL uit met de belangrijkste server-statistieken die het programma toont in zijn toepassingsvenster. Blijkbaar ontging het Chuck deze custom URL te verwijderen toen het aan MacHTTP toebehoorde, of tijdens de omzetting naar WebSTAR, maar hij deed het voor WebSTAR 1.3.1, toen het bestaan van deze URL bekend werd. Hoewel de URL absoluut geen problemen gaf wat betreft file-veiligheid, wilden vele WebSTAR-gebruikers niet dat zomaar iedereen de statistieken kon raadplegen.

<http://www.starnine.com/webstar/webstarupdates.html>
<ftp://ftp.starnine.com/pub/updates/webstar/webstar_version_history>

Maxum lanceert NetForms 2.0 & Phantom 1.1 -- Maxum Development heeft een snellere en Open Transport-native versie uitgebracht van NetForms 2.0, zijn populaire back-end server tool, die Mac Webmasters in staat stelt gesofistikeerde vorm-processing te doen van hun Web-sites. Huidige licentiehouders van NetForms kunnen eenvoudigweg de hand leggen op de demo-versie. Maxum lanceerde onlangs ook versie 1.1 van Phantom, een Mac-gebaseerde Web-robot, die zoekbare HTML-indexen van Web-sites opbouwt en "mirroring" en updating voorziet van sites. Phantom is compatibel met robot-uitsluitings-standaarden en voorziet een paswoord en tevens o.a. boole- en fonetische zoekfuncties. Phantom 1.1 is een upgrade voor Duppies 1.0 van AKTIV Software en is gratis voor licentiehouders van Duppies. Nieuwe gebruikers kunnen Phantom kopen voor $295 tot 31 juli 1996.

<http://www.maxum.com/>

Rondneuzen bij Pacific Northwest -- Twee nieuwe applicaties van Pacific Northwest developers, namelijk Open Door Networks in Oregon en ComVista Internet in Washington, zijn een hulp voor Webmasters bij het werken met logs. LogDoor van Open Door Networks (dat $249 kost maar in introductie slechts $179 met leveringsdatum tusen 1/9/96 en 1/11/96. Een evaluatie-versie is nu beschikbaar) voorziet real-time logs voor meervoudige sites op een enkelvoudige server die HomeDoor (tevens van Open Door Networks) gebruikt. Het splitst enkelvoudige, uit-een-stuk-files in kleinere, meer handelbare files. LogDoor kan tevens zijn real-time logs tonen via het Web. Hoewel OpenDoor 1.0 momenteel één basis-feature set heeft, bestaan er plannen om zaken toe te voegen zoals dokumentniveau-logging en real-time grafische mogelijkheden. Het gratis LogRoller van ComVista heeft meer eenvoudige specificaties: het werkt met WebSTAR om een nieuwe log te creëren, een oude te herbenoemen en de oudere naar een gebruikers-gespecifiëerde folder te verplaatsen. Geen manuele editing meer van grote log-files om de correcte tijdsperiode te overlappen. LogRoller kan je logs elk uur, dagelijks, wekelijks of maandelijks overlopen.

<http://www.opendoor.com/logdoor/>
<http://www.comvista.com/soft/logroller/>

Microsoft geeft de Massa Macht

door Tonya Engst <[email protected]>

Geregistreerde gebruikers van Microsoft's Excel 5, PowerPoint 4, Word 6 of Office 4 moeten op hun brievenbus letten voor een gratis CD-ROM, getiteld The Microsoft Empowerment Pack for the Macintosh. De CD bevat zowel de Systeem 7.5 Update 2.0 (die Systeem 7.5, 7.5.1 of 7.5.2 opwaardeert naar versie 7.5.3; zie TidBITS-318) als de Systeem 7.5.3 Revisie 2 (die gebruikt moet worden op sommige computers met Systeem 7.5; zie TidBITS-332). Volgens Microsoft laat Systeem 7.5.3 Office-toepassingen sneller starten.

De CD biedt ook de Word 6.0.1a update, Internet Explorer 2.0.1, een verzameling ge-cache-de Web-sites, Internet Assistant voor Word en Excel, een aanbieding voor korting op RAM van Kingston, en meer. Klaarblijkelijk vroeg Bill Gates zich, tijdens een recente zakelijke terugblik, af wat er gedaan zou kunnen worden om Mac-klanten gelukkiger te maken, en is deze CD het resultaat van die discussie.

Geregistreerde Microsoft Office 3 gebruikers (of mensen die in het bezit zijn van applicaties die onderdeel uitmaken van Office 3) zullen een briefkaart ontvangen die ze moeten insturen om in het bezit van de CD te komen. Helaas bevat de CD alleen Engelstalige versies van Microsoft software, en heeft Microsoft momenteel geen plannen om de CD buiten de Verenigde Staten aan te bieden, of om versies in andere talen uit te brengen.

<http://www.microsoft.com/corpinfo/press/1996/jul96/macpckpr.htm>

Op het hoesje van de CD staat de merkwaardige kreet "may not change your world", een bewering die Adam in hoge mate verbaasde en amuseerde, omdat ik na het openen van het pakketje het ingewikkelde hoesje zodanig had opgevouwen dat de clou, "it just might expand it", begraven was onder verscheidene lagen karton. Nadat je de CD uit zijn verpakking hebt gepeuterd, maar voordat je hem gaat gebruiken, kun je je voordeel doen met de door TidBITS-lezer Corl Riblet gemelde ervaringen. Toen Corl het Microsoft Empowerment Pack opstartte, schrok hij dusdanig van de ontdekking dat in plaats hiervan Microsoft Internet Explorer opstartte, dat hij -enigszins in paniek geraakt- het opstarten afbrak. En inderdaad, het Empowerment Pack gebruikt voor zijn installatie Internet Explorer, dus schrik niet!

Het Empowerment Pack laat helaas ook na om een belangrijk onderscheid te maken tussen hen die de Word 6.0.1a updater moeten installeren, en zij die dit niet hoeven. Wanneer je een gebruiker van Word 6.0 bent zul je naar alle waarschijnlijkheid de updater willen draaien, om gebruik te kunnen maken van de vele verbeteringen die versie 6.0.1 te bieden heeft. Het Word Update/Product Info gedeelte van het Empowerment Pack beschrijft sommige van die verbeteringen op een globale wijze, maar laat na om te voorzien in een Web-link of een verwijzing naar de kern van de zaak, die je online kunt vinden op:

<http://www.microsoft.com/kb/deskapps/word/q129242.htm>

Voor gebruikers van Word 6.0.1 voegt versie 6.0.1a één ding toe, en niet meer dan dat - het voegt als programma-onderdeel de aan Word gerelateerde functionaliteit toe die ook beschikbaar is via de Office 4.2x Update voor Power Mac, die enkele crash-problemen corrigeert op Power Macintoshes (zie TidBITS-289). Het installeren van 6.0.1a op om het even welke Macintosh heeft alleen zin als vervanging van 6.0; het heeft geen zin als vervanging van 6.0.1 op een 68K Mac.

Het is me niet gelukt om vast te stellen welke versie van de Office 4.2x Update voor Power Mac in Word 6.0.1a terecht is gekomen. Versies n/a en 1.0 van de updater conflicteerden met de Global Village Toolbox extensie en met STF Technologies FAXstf software. Microsoft heeft dit probleem verholpen met versie 1.01. Volgens Ric Ford's MacInTouch News Archive van 11-Jul-96 conflicteren vroege versies van de Office 4.2x Update voor Power Mac ook met Systeem 7.5.3's Apple-menu-uitbreiding regelpaneel.

<http://www.macintouch.com/newsarch1996q3.html>

De Empowerment Pack installer geeft je niet de keuze om een 68K, een fat of een PowerPC versie van Word 6.0.1a te installeren, en volgens Corl (die dit besprak met een Microsoft Support technicus) installeert het Empowerment Pack een fat versie, dus pas op als je harde schijf bijna vol is. Verslagen van Corl en ook op Usenet wijzen erop dat de fat versie ongeveer 4 MB toevoegt aan Word zelf, als je voordien niet de fat versie op schijf had staan.

Vreemd genoeg bevat het pakket niet de additionele document-omzetters die verkrijgbaar zijn voor Word, noch enige verwijzing naar dergelijke updates. Via Microsoft's online kennisbank kun je hierover meer te weten komen:

<http://www.microsoft.com/kb/deskapps/word/q119859.htm>

Persoonlijk zou ik graag zien dat Microsoft van zo'n CD een jaarlijkse uitgave maakt. Bovendien zou ik dan graag zien dat deze automatisch alle kleine updates bevat die verband houden met Office software, benevens uitgebreide en intelligente informatie en links naar Microsoft's online kennisbank.

Claris OfficeMail: voor binnen en buiten

door Adam C. Engst <[email protected]>

Claris OfficeMail vormt een interessante oplossing voor kleine bedrijfjes en scholen die e-mail willen ontvangen en versturen. Deze organisaties willen namelijk e-mail als intern communicatiesysteem gebruiken, maar ook via het Internet corresponderen met anderen. Maar meestal beschikken ze niet over grote budgetten of over medewerkers die in staat zijn om een mailserver te laten draaien. En hoewel het Internet onder meer dankzij het WWW enorm populair geworden is, hebben deze organisaties ook nog geen vaste Internetverbinding.

<http://www.claris.com/products/ClarisOfficeMail/>

Voor 299$ haal je met OfficeMail een LAN e-mail server in huis die ook SMTP en POP ondersteunt, de protocollen die het elektronische postverkeer op het Internet regelen. Eén van de voordelen waarover OfficeMail pretendeert te beschikken, is een eenvoudige installatie; drie stappen voor intern gebruik en nog eens drie stappen als je ook via het Internet post wil uitwisselen. Ik heb die stappen zelf ook eens doorlopen en het blijkt inderdaad doodsimpel, waarvoor Claris een stevige pluim verdient. Je kan zelfs die eigen subdomein aanmaken binnen het 'clrs.com'-domein.

Het pakket bevat onder andere vijf exemplaren van Claris Emailer, waarmee je je post kan lezen. Da's goed nieuws, want Emailer is een krachtige e-mail client met enkele onmisbare eigenschappen, zoals de mogelijkheid om niet alleen e-mail van het Internet te ontvangen, maar ook van America Online en CompuServe. Daartegenover staat de vreselijke gewoonte om voor elk bericht een apart bestand aan te maken, maar dat zal waarschijnlijk in een volgende versie worden rechtgezet. Met de beperkte hoeveelheid post die de meeste OfficeMail-gebruikers genereren, zal deze werkwijze trouwens geen probleem vormen. Je kan natuurlijk ook Eudora Light of een andere POP-compatibel Internet e-mail programma gebruiken om post uit te wisselen met een Claris OfficeMail server.

OfficeMail heeft niet zo hoge systeemvereisten. Aangezien de meeste kleine bedrijfjes en scholen gebruik zullen maken van een oude Mac die daar nog ergens rondhangt. OfficeMail draait op een 68020 of hoger, met 4 MB Ram voor een 68K-model of 8 MB voor een PowerMac. Hou wel een flink deel van je harde schijf vrij want OfficeMail moet alle inkomende berichten kunnen bewaren tot de bestemmeling ze leest - en met een paar ferme attachments erbij kan dat heel wat plaats in beslag nemen. Je hebt natuurlijk ook AppleTalk of TCP/IP nodig, maar een constante verbinding met het Internet is niet nodig want OfficeMail maakt gebruik van een modem (liefst een snelle) om post uit te wisselen via het Internet.

Via deze modem legt OfficeMail een verbinding met ClarisLink, een service die onderhouden wordt door HoloNet en waarvoor gebruik wordt gemaakt van inbelpunten van het CompuServe Packet Network (en daardoor waarschijnlijk over heel de wereld bereikbaar). Hiervoor betaal je 39,95$ per maand voor 10 uur en ongeveer 5,95$ per uur als je daarboven zit. Je betaalt ook eenmalig 25$ voor de registratie. Voor de meeste gebruikers zal tien uur connectietijd zeker volstaan, en dus is de prijs voor dit abonnement zeker redelijk te noemen. De reden waarom men deze lage prijs kan handhaven, is dat men hiervoor gebruik maakt van UUCP (Unix to Unix CoPy), een al wat ouder Internet-protocol dat vroeger werd gebruikt om e-mail en Usenet nieuws te versturen.

Als je nog maar onlangs met het Internet hebt kennis gemaakt, zal je misschien nog nooit van UUCP gehoord hebben. UUCP is een nogal obscure techniek en de programma's zijn al in lange tijd niet meer aangepast omdat weinig mensen nog geïnteresseerd zijn in de ontwikkeling ervan. Maar bij sommige Internetproviders kan je nog altijd een UUCP-abonnement nemen en aangezien je voor e-mail perfect off-line kan werken (met je computer - liefst allemaal automatisch - een verbinding leggen met de mailserver, er berichten mee uitwisselen en daarna onmiddellijk de verbinding onderbreken), is zo'n account best bruikbaar. Hier bij TidBITS hebben we ook jaren met UUCP gewerkt tot we ons eind 1994 een vaste lijn konden permitteren, en in de eerste twee edities van de Internet Starter Kit voor de Macintosh heb ik er nog vrij veel over geschreven. In de derde, gedrukte uitgave werd dit hoofdstuk weggelaten, maar wie er meer over wil weten, vindt het nog altijd in de elektronische versie.

<http://www.mcp.com/hayden/iskm/iskm3/pt3/ch15/ch15a.html>

Het belangrijkste UUCP-programma voor de Macintosh, uAccess, is door InterCon Systems nog een tijdje verdeeld geweest als UUCP/Connect, maar naar verluidt zijn de auteursrechten al enige tijd weer bij Tim Endres, de oorspronkelijke ontwikkelaar ervan, en sindsdien werd er niets meer van gehoord. Er zijn nog twee gratis UUCP-clients, namelijk Mac/gnuucp en uupc (waarvan binnenkort wel eens een upgrade zou kunnen uitkomen). Op de onderstaande URL vind je waar nog UUCP-software beschikbaar is.

<ftp://ftp.tidbits.com/pub/tidbits/tisk/inet/uucp/>

Door gebruik van te maken van de UUCP-technologie en daarvoor een specifieke Internetprovider aan te duiden, heeft Claris de moeilijkheden weggewerkt die het werken met TCP en eventueel ook PPP met zich meebrengt. En het instellen van deze twee elementen vormt doorgaans de grootste problemen voor beginnende gebruikers, vooral als men niet over voldoende handleidingen beschikt (precies daarom wijdt de vierde editie van de Internet Starter Kit voor de Macintosh een volledig hoofdstuk aan het oplossen van problemen met het leggen van de verbinding).

Maar tegelijkertijd heeft Claris er blijkbaar ook voor gekozen om OfficeMail geen volwaardige SMTP-server te maken, wat niet zo duidelijk blijkt uit de publiciteit die Claris rond dit programma uitbrengt. Hoewel e-mail clients zoals Eudora via SMTP kunnen communiceren met OfficeMail, kan OfficeMail op zijn beurt geen e-mail naar het Internet versturen via SMTP. Dat is wel het geval met volwaardige SMTP-servers zoals het gratis Apple Internet Mail Server en het flexibele CommuniGate-systeem van Stalker Software, wat ook gedurende een evaluatieperiode gratis kan worden gebruikt. Dus zelfs al heb je een vaste Internetverbinding, toch moet je met een modem verbinding maken met ClarisLink om via OfficeMail post uit te wisselen.

<http://cybertech.apple.com/AIMS.html>
<http://www.stalker.com/CommuniGate/CommuniGate.html>

Maar eigenlijk is dat niet helemaal waar - je hoeft niet per sé via ClarisLink contact te maken. OfficeMail lijkt alleen met ClarisLink te werken, maar middels een 'undocumented feature' kun je een UUCP account bij een willekeurige Internet provider gebruiken, of je kunt dat tenminste proberen. Claris verklapt of documenteert deze eigenschap niet, omdat het opzetten van een UUCP-account niet makkelijk is, maar met de nodige moeite moet het mogelijk zijn. OfficeMail spreekt het modem aan via de Apple Modem Tool, dus je kunt de instellingen daarvan wijzigen zodat-ie belt naar je Internet provider. Vervolgens is er in de Claris OfficeMail-map nog een andere map genaamd Claris OfficeMail Files. Daarin is een bestand met de naam Mail Connect Script, een tekstbestand met het verbindingsscript dat OfficeMail gebruikt om in te loggen en e-mail op te halen. Dit is niet een taak voor de zwakkeren van gestel, maar het is mogelijk om het script te wijzigen (hou back-ups bij!) zodat verbinding gemaakt wordt met je Internet provider in plaats van ClarisLink. De scripttaal is wat merkwaardig, maar wel eenvoudig, en bovenaan het Mail Connect Script-bestand wordt voorzien in een korte uitleg. Ten overvloede merken we op dat je natuurlijk van Claris absoluut geen hulp kunt verwachten als je deze truuk uitprobeert, maar als je ervaring hebt met UUCP en iemand anders aan het helpen bent met het opzetten van een UUCP-account, dan kan dit een goede oplossing zijn.

Resumerend: als je geen vaste Internet-verbinding hebt en e-mail wilt, dan is Claris OfficeMail het overwegen waard. Als je een vaste Internet-verbinding hebt via modem naar een enkele Mac, maar niet naar het hele netwerk, kijk dan naar CommuniGate, of naar de combinatie van Apple Internet Mail Server en het shareware AIMS LocalTalk Bridge, waarmee je intern mail kunt distribueren naar Macs op je netwerk die Eudora Light draaien. Ten slotte, als je een vaste Internet-verbinding hebt voor je hele netwerk, probeer dan Apple Internet Mail Server of CommuniGate.

<ftp://ftp.tidbits.com/pub/tidbits/tisk/inet/mail/aims-localtalk-bridge-13.hqx>

P.S.: Na Claris OfficeMail ontvangen en geïnstalleerd te hebben, voer ik in de eerste kladversie van dit verhaal uit over twee dingen: ik ergerde me aan Claris' onnozele spelling van OfficeMail als "OfficeM@il" (zoals bij "Em@iler"), maar vooral ergerde ik me aan het feit dat in alle OfficeMail-informatie beweerd werd dat OfficeMail een aantal Internet-standaarden ondersteunt, waaronder SMTP. Maar ik kon het niet aan de praat krijgen als SMTP-server, noch kon ik enige SMTP-instelopties vinden. Ik besloot dit alles bij Claris na te gaan, en pas toen ik de ontwikkelaar persoonlijk te spreken kreeg, kon ik bevestigd krijgen dat OfficeMail helemaal niet met SMTP servers verbinding kan maken, dat OfficeMail standaard-UUCP gebruikt, en dat het theoretisch mogelijk was om andere UUCP-accounts te gebruiken. In de propaganda werd niet eens gerept over de ondersteuning van UUCP als een van de Internet-standaards die OfficeMail ondersteunt - de term UUCP komt op Claris' Web site alleen voor in een prijsvergelijking. Volgens mij zijn dit anders behoorlijk belangrijke punten, die dan ook vermelding verdienen ergens in de documentatie en recensentengids van OfficeMail. OfficeMail mag dan fantastisch zijn voor onervaren gebruikers, maar als het de geavanceerde gebruikers en schijvers verwart door incomplete documentatie, dan bestaat er een groot risico dat het programma onverdiend slechte pers ontvangt.

Zo sluit je je Net-hoekje af voor robots

door Tonya Engst <[email protected]>

Zoekmachines en zoekgereedschappen zijn dezer dagen alomtegenwoordig op het Internet. Men begeeft zich massaal naar zoekmachine-sites om snel informatie te vinden, en de informatie die beschikbaar is verschijnt met een schrikbarende breedte en diepte. (Zie het artikel van Kirk McElhearn in TidBITS-333).

Ik heb bijvoorbeeld net in AltaVista gezocht naar "watermelon." (watermeloen). Ik heb nog amper aan de oppervlakte van de zoekresultaten geraakt, maar ik heb nu al gelezen over de stand van zaken aangaande de Texaanse watermeloenen-oogst (compleet met voedingswaarde-informatie), en ook heb ik al een Web site bezocht die gewijd is aan "Stilleven met watermeloen en granaatappelen", het schilderij van Cezanne.

Indexeringsrobots -- Zoekmachines verzamelen veel van hun informatie middels robots, die ook wel bekend staan als 'spiders' (spinnen) of 'crawlers' (kruipers). Robots doorkruisen het Web op zoek naar informatie om op te slaan. Robots beginnen over het algemeen bj een URL die eruit ziet als een redelijk startpunt, zoals een URL die door een gebruiker is opgegeven, een pagina die veel links heeft, of het topniveau van een site. Een robot gaat naar binnen via de beginpagina, en loopt vervolgens recursief alle pagina's af waarnaar vanaf die beginpagina gekoppeld wordt. Misschien gaat de robot ook alle pagina's na die hij kan vinden op een bepaalde server. Na het inladen van een pagina werkt de robot samen met de zoekmachine om delen van de pagina te indexeren; misschien de titel, of een deel van de tekst of zelfs alle tekst, of bepaalde sleutelwoorden, of andere nader aangeduide elementen.

Er is echter een onderwerp dat nadere aandacht verdient: hoe voorkom je dat zoekmachines bepaalde Web-pagina's of Usenet nieuwsgroep-berichten gaan indexeren? Er zijn conventies die robots moeten weghouden van speciaal gemarkeerde Web-pagina's of nieuwsgroep-berichten, maar het gehoorzamen van individuele robots aan deze conventies is totaal vrijwillig. Tot nu toe lijken de belangrijkste zoekmachines deze conventies te respecteren.

Hee jij daar, wegwezen van mijn plekkie -- Door het Exclusion Protocol van robots te gebruiken, kan je robots vragen Web pages te negeren die je niet geindexeerd wilt hebben. Het zou bijvoorbeeld kunnen dat je bepaalde gegevens op het Web hebt staan, zonder dat je die in een search engine de kop op wilt laten steken. Daarvoor zou je natuurlijk een password systeem op kunnen zetten, maar dat zou wel eens ingewikkelder kunnen zijn dan je wilt. Een andere mogelijkheid is een site te hebben die zo vaak van inhoud verandert, dat er weinig nut is voor een robot om te proberen deze te indexeren.

Om robots te vertellen dat ze weg moeten wezen, plaats je een robots.txt file op het lokale root niveau van een Web site. Met gebruikmaking van een specifieke syntax, geeft deze file aan robots de informatie dat ze af moeten blijven van bepaalde (of alle!) gedeeltes van de server. Als je een dergelijke file wilt maken, beveel ik het lezen van de World Wide Web Robots, Wanderers, and Spiders page aan:

<http://info.webcrawler.com/mak/projects/robots/robots.html>

Om toch een kort voorbeeld te geven: als je alle robots wilt vertellen dat ze af moeten blijven van een directory met de naam watermelon, kan je robots.txt file er als volgt uit zien:

User-agent: *
Disallow: watermelon/

Als je niet genoeg controle over je server hebt om een dergelijke robots.txt file op te zetten, zou je kunnen proberen om een META tag aan de head sectie van een HTML document toe te voegen. De volgende tag:

<META NAME="ROBOTS" CONTENT="NOINDEX">

vertelt robots dat ze de betreffende pagina niet moeten indexeren. Deze tag:

<META NAME="ROBOTS" CONTENT="NOFOLLOW">

vertelt robots dat ze de links op deze pagina niet moeten volgen. De ondersteuning voor de META tag onder robots is minder wijdverspreid dan het Robots Exclusion Protocol, alhoewel de meest belangrijke Web indexes het op dit moment wel ondersteunen. Informatie over de META tag voor robots kan gevonden worden in de Spidering BOF (Birds of a Feather) Report:

<http://www.w3.org/pub/WWW/Search/9605-Indexing-Workshop/ReportOutcomes/Spidering.txt>

Privé Nieuws -- Om de vingers van search engines van je Usenet nieuwsberichten af te houden, is het mogelijk om een "X-no-archive" regel aan de headers van je berichten toe te voegen:

X-no-archive: yes

Alhoewel veel news clients zoals NewsWatcher het toestaan om X-no-archive regels aan de headers toe te voegen, is het nog niet hopeloos als het met jouw specifieke client niet mogelijk is. Op zijn minst een engine, Deja News, zal je bericht negeren als je de volgende tekst de eerste regel laat zijn in de body van je bericht:

X-no-archive: yes

Bovendien zal Deja News als je er persoonlijk om vraagt je berichten uit hun archief verwijderen. Stuur hiervoor een mail aan <[email protected]>.

Veronderstelde Non-Privacy -- De bron van verwarring betreffende privacy en Internet indexeersystemen komt gewoonlijk van de onderstelling (die de meeste search engines maken) dat alle informatie die zij vinden publiek is, tenzij anders is aangegeven.

Veel Internet veteranen hebben geen probleem met deze veronderstelling, omdat veel materiaal op wat voor wijze dan ook wel beschikbaar is. Desalniettemin vinden sommige nieuwe Internet gebruikers deze praktijk nogal storend. Voor deze gebruikers is het alsof hen verteld wordt dat elk telefoongesprek dat zij het afgelopen jaar gevoerd hebben opgenomen is door een bedrijf, dat deze gesprekken nu doorgeeft aan een ieder die daarom vraagt.

Het lange-termijn geheugen van deze search engines maakt de gevolgen van hun gedrag groter dan ooit. Alhoewel de AltaVista search engine van Digital op dit moment alleen de laatste paar maanden van Usenet onthoudt, heeft Deja News archieven die teruggaan tot vroeg in 1995. Deja News claimt dat ze helemaal tot in 1979, toen Usenet begon, terug willen gaan voor zover mogelijk. Hoeveel mensen zullen in 1979 geweten hebben van de X-no-archive tag? Alhoewel de robot and 'archive exclusion' standaarden je kunnen helpen om je materiaal uit grote indexen te houden, zijn er ook dergelijke systemen die die regels niet respecteren.

Als je zeer verontrust bent over de privacy van je email en Usenet berichten, zou je eens moeten kijken naar anonymous remailers en PGP, een controversieel sterk encryptie programma van Phil Zimmerman. Beide onderwerpen vallen buiten het bereik van dit artikel.

<http://www.well.com/user/abacard/remail.html>
<http://www.io.com/~combs/htmls/crypto.html>
<http://world.std.com/~franl/pgp/>

Als je er niet zo verontrust over bent, onthoudt toch dat je woorden op Internet onsterfelijk kunnen worden - alles wat je schrijft op Usenet zal ergens voor eeuwig bewaard blijven, en hetzelfde geldt voor het Web. Kies je woorden met zorg - het kan zijn dat je ze weer tegenkomt in een toekomstige situatie die je je nu nog niet eens voor kunt stellen.

In de toekomst zal privacy alleen nog maar belangrijker worden op het Internet, en kunnen we commerciele nieuwslezers en publikatiegereedschappen verwachten die zich op de borst slaan voor hun "privacy compatibility". Zonder twijfel zullen snel nieuwslezers standaard geconfigureerd zijn om X-no-archive headers te gebruiken, en Web auteursprogramma's zullen voorkeuren hebben voor het invoegen van robot META tags en automatisch robots.txt files creëren. Desalniettemin zal dit geen verandering tot gevolg hebben van de fundamentele opvatting van Internet indexering tools: alles is publiek.

Niet-winstgevende en niet-commerciële publikaties mogen artikels overnemen of een HTML-link maken als de bron duidelijk en volledig vermeld wordt. Anderen gelieve ons te kontakteren. We garanderen de precisie van de artikels niet. Caveat lector! Publikatie-, produkt- en firmanamen kunnen gedeponeerde merken zijn van ondernemingen. Voor meer informatie over TidBITS: hoe zich te abonneren (enkel engelstalige versie!!!), waar vroeger edities te vinden en andere nuttige dingen, stuur e-mail naar: <[email protected]>. Anders,contacteer ons op: <[email protected]>.

Vroegere edities verkrijgbaar via ftp en www:
<ftp://ftp.tidbits.com/pub/tidbits/issues/>
<http://www.tidbits.com/tb-issues/>

Om oude edities te zoeken, gebruik volgende URL met een webbrowser:
<http://wais.sensei.com.au/macarc/tidbits/searchtidbits.html>