Vorige aflevering | Search TidBITS | TidBITS Homepage | Volgende aflevering

TidBITS#544/21-Aug-00

Wil je een groter beeldscherm? Lees hoe je het zichtbare beeld kunt vergroten op de meeste schermen met een beeldbuis. Verder in dit nummer weer een bespreking door Matt Neuburg, dit keer over IBM's ViaVoice software voor spraakherkenning. Enkele belangrijke releases deze week zijn Interarchy 3.8, een bijgewerkte en omgedoopte versie van Anarchie, en Adobe GoLive 5.0, de laatste versie van het krachtige Web ontwerp pakket. De enquête van deze week: welke futuristische techonologieën zou je het liefst werkelijkheid willen zien worden?

Onderwerpen:

Copyright 2000 TidBITS Electronic Publishing. All rights reserved.
Information: <[email protected]> Comments: <[email protected]>


-> Denk je dat TidBITS interessant is voor <-
-> je vrienden, kennissen, collega's? Geef <-
-> hen de tip zich ook GRATIS te abonneren <-
-> of stuur deze aflevering naar hen door! <-


Je kunt je gratis abonneren op de Nederlandse afleveringen van TidBITS door een (blanco) mailtje te sturen naar: [email protected]. Je krijgt deze dan per e-mail toegestuurd.
Om je abonnement op te zeggen, kun je een mailtje sturen naar: [email protected].


Deze editie van TidBITS werd gedeeltelijk gesponsord door:


De Nederlandse editie van TidBITS is een letterlijke vertaling van de oorspronkelijke Engelse versie. Daarom is het mogelijk dat een deel van de inhoud niet geldt in bepaalde landen buiten de USA.

Dit nummer werd uit het Engels vertaald door:

Verder werkten mee:


MailBITS/21-Aug-00

[vertaling: SL, EA, MK]

Update van Anarchie omgedoopt in Interarchy 3.8 -- Stairways Software kwam vandaag met een belangrijke update van hun populaire shareware FTP client Anarchie. Tevens heeft Stairways besloten om Anarchie voortaan Interarchy te noemen en om Interarchy als nieuwe identiteit van het bedrijf te gebruiken na mislukte pogingen om het domein anarchie.com terug te krijgen van een cyberkraker. Interarchy 3.8 ondersteunt FTP listing, upload, download, en mirroring; HTTP listing, download, en mirroring; Whois, Finger, en DNS lookups; traceroutes; en TCP, ICMP, en UDP tests. Interarchy kan ook de status van je netwerk tonen, alle netwerkverkeer bekijken op je Mac, en een lijst tonen van alle aansluitingen van het moment. Tot slot biedt Interarchy nu daemons (kleine servers) voor Finger, Whois, TCP echo, UDP echo, Ident, Daytime, Time, en NTP (allemaal aan te zetten met het Safe Daemons menu item), plus een Telnet daemon die AppleScript scripts aanvaardt en uitvoert. Zij zijn standaard allemaal uitgeschakeld. Meest belangwekkend zijn echter Interarchy's skin-achtige "toverstokjes". Dit zijn volledig aanpasbare grafische interfaces naar Interarchy's functionaliteit. Om je een idee te geven hoe een toverstokje van pas kan komen wil ik er een maken dat me helpt problemen met verbindingen op het Internet te analyseren door middel van knoppen voor ping en traceroute tests op mijn diverse servers. Per saldo is Interarchy 3.8 een krachtige en flexibele verzameling Internet tools die in het begin aanvoelt als los zand. Het moet nog blijken of Interarchy's toverstokjes er in zullen slagen de nodige samenhang te bregen. Interarchy 3.8 is een download van 3.9 MB en kost $50 shareware, maar is gratis voor gebruikers van Anarchie 3.x (hij gebruikt het serienummer dat je al hebt) en voor geregistreerde gebruikers van de Stairways shareware programma's welke Interarchy vervangt. [ACE]

<http://www.interarchy.com/>

Adobe GoLive 5 uitgebracht -- Adobe is begonnen Adobe GoLive 5 te verzenden, hun vlaggenschip van de Web design pakketten. De nieuwe versie voegt een aantal functionaliteiten toe die beter inspelen op de manier waarop huidige Web sites ontworpen en opgezet zijn: de Design eigenschap maakt snelle grafische voorstelling en prototypering mogelijjk; Dynamic Link maakt het gemakkelijk om informatie uit een database aan Web pagina's te binden; 360Code verzekert je ervan dat bestaande HTML niet geherformateerd wordt door GoLive; en de WebDAV (Web Distributed Authoring and Versioning) implementatie biedt versie controle en asset management (bronbeheer) voor een team van ontwerpers die aan eenzelfde project werken. GoLive omvat nu ook Smart Objects die het mogelijk maken van Photoshop, Illustrator of Livemotion bestanden op een pagina te slepen en ze later dynamisch te updaten zonder steeds weer door het proces van Web-klare kopiëën exporteren te moeten worstelen. GoLive 5 is als electronische download beschikbaar voor $299. Eigenaars van Pagemill of vroegere versies van GoLive kunnen upgraden voor $99; een competitieve upgrade van $149 wordt eveneens aangeboden aan eigenaars van Macromedia Dreamweaver of Microsoft Frontpage. Het programma vraagt een op PowerPC gebaseerde Mac met Mac OS 8.6 of later, en minstens (maar lieftst meer dan) 48MB beschikbaar RAM. [JLC]

<http://www.adobe.com/products/golive/main.html>

De vijfde plaats voor ons! Felicitaties voor TidBits uitgever Adam Engst voor zijn vijfde plaats in de Macdirectory "Meest invloedrijk figuur in de Mac-industrie" opiniepeiling van bijna 200 Macdirectory lezers. Net zoals in de MDJ power 25 peiling, kaapte Macs iCEO Steve Jobs de eerste plaats weg met een ruime marge, maar deze keer was Microsoft voorzitter Bill Gates tweede, gevolgd door Apples medeoprichter Steve Wozniak en de onnavolgbare Guy Kawasaki (momenteel de CEO van Garage.com). [GD]

<http://www.macdirectory.com/4u/wire.fm$RETRIEVE?value=8403&field=Serial&html=NewsDetail.html>
<http://db.tidbits.com/getbits.acgi?tbart=06045>

Enquête-voorbeschouwing: (Apple) Pie in the Sky -- Matt Neuburg laat verderop in deze aflevering zijn licht schijnen over IBM's ViaVoice stemherkenningssoftware voor de Macintosh, en zijn bespreking zette ons aan het denken over andere aspecten van het ontwerp van toekomstige computersystemen. Tot nu toe hebben we pogingen gezien -met wisselend succes- tot het inbouwen van handschriftherkenning, het weghalen van lastige draden tussen de verschillende computeronderdelen en miniaturisatie. We hebben ook af en toe een voorbode gezien van nieuwe technologieën als virtual reality interfaces, biometrische beveiliging (zoals de stemgestuurde wachtwoordbeveiliging in Mac OS 9), in glas ingebedde head-up displays, en zelfs hersengolfherkenning (van IBVA Technologies). Maar vaak is het succes van deze grensverkennende technologieën uitgebleven, niet door de manier waarop ze werden geïmplementeerd, maar door het ontbreken van acceptatie door het publiek. Vertel ons middels de enquête van deze week dus maar eens met welke technologieën de huidige of toekomstige Macs volgens jullie zouden moeten worden toegerust. Breng je stem uit op onze home page, en als we een belangrijke trend over het hoofd hebben gezien, vertel ons dat dan in TidBITS Talk op <[email protected]>. [ACE]

<http://www.tidbits.com/>
<http://www.ibva.com/>


Haal alles uit je beeldscherm

door Adam C. Engst en Geoff Duncan <[email protected]>
[vertaling: MK, JG, JS]

In de quiz van vorige week moest er gekozen worden uit verschillende mogelijkheden om meer op de desktop van je Mac te zien. Het goede antwoord was, dat al deze mogelijkheden je in staat stelden om meer te zien, hoewel ze anders werken. Laten we even kijken naar elk van de antwoorden, want hoewel de meesten van jullie waarschijnlijk goed thuis zijn in deze materie (ongeveer tweederde van de respondenten gaf het juiste antwoord), is het goed om dit door te geven aan vrienden en bekenden die minder ervaren zijn in het gebruik van de Mac.

<http://db.tidbits.com/getbits.acgi?tbpoll=53>

Instellen van de schermresolutie wil zoveel zeggen als het veranderen van het aantal pixels die de hoogte en breedte van je scherm bepalen. Met een instelling van 1024 bij 768 kun je meer op je desktop zien dan als je de resolutie instelt op 640 bij 480 -hoewel, afhankelijk van je beeldscherm, een lagere resolutie comfortabeler in het gebruik kan zijn. Gebruik het regelpaneel Monitors of de Control Strip module screen resolution voor het wijzigen van je schermresolutie. Je veranderingen worden meteen zichtbaar, dus een herstart is niet nodig. Wel kunnen voorwerpen op je desktop een andere plaats krijgen als je een kleiner scherm kiest (en als je de resolutie vaak verandert, kijk dan eens naar "Gereedschap dat we gebruiken: Desktop Resetter" in TidBITS-466 voor informatie over een utility die de positie van de desktop ikoontjes onthoudt). Veel nieuwe gebruikers realiseren zich niet dat het mogelijk is de schermresolutie te wijzigen en werken daardoor met een instelling die misschien helemaal niet de meest geschikte is voor hun situatie. Als wij Macs inrichten voor vrienden of familieleden, laten we ze altijd verschillende schermresoluties zien en vragen we welke ze het prettigst vinden.

<http://db.tidbits.com/getbits.acgi?tbart=05273>

Het toevoegen van een extra beeldscherm is een van de uitstekende, onbezongen mogelijkheden van de Mac: de meeste Macs kunnen twee of meer beeldschermen besturen die gecombineerd een enkel vergroot bureaublad kunnen maken. Meer beeldschermen is een uitstekende manier om productiviteit te verhogen: stel je eens voor dat je een bepaald onderwerp in een Web browser aan het onderzoeken bent op één scherm terwijl je aan het schrijven bent in je tekstbewerker op een ander. Niet alle Macs ondersteunen meer beeldschermen, maar bijna ieder model dat veelvoudige video kaarten kan hanteren kan meedere beeldschermen hanteren. Tevens kunnen sommige Macs die fysiek meer beeldschermen ondersteunen dat alleen maar doen in de video-mirror mode, waarbij beide schermen hetzelfde beeld laten zien inplaats van een combinatie om een enkel, groter bureaublad te creëren. We hebben uitgebreid over veelvoudige beeldschermen geschreven in het verleden (zie onze "Meer Monitoren!" series artikelen voor detailles en advies), en het onderwerp komt vaak in TidBITS Talk naar boven.

<http://db.tidbits.com/getbits.acgi?tbser=1033>
<http://db.tidbits.com/getbits.acgi?tlkthrd=18+977+1102+1122+1123+1129>

Virtuele bureaubladen lijken veel op veelvoudige beeldschermen in dat ze het mogelijk maken om een grotere maat bureaublad te hebben. Anders dan meedere beeldschermen is het uitgebreide bureaublad echter niet te zien op een afzonderlijk scherm; in plaats daarvan kan je scrollen of je hoofdscherm(en) verschuiven om extra bureaublad ruimte in zicht te brengen. Bepaalde video kaarten maken virtuele bureaubladen mogelijk door hun driver software; andere zuiver softwarematige systeemuitbreidingen zoals Virtual Desktop van AWOL Software en Virtual van Pierre-Luc Paour bieden ook virtuele bureaublad capaciteiten aan, alhoewel geen van tweeën in de afgelopen tijd geüpdatet is (en de auteur van Virtual het gebruik met Mac OS 9 afraadt).

<http://www.magma.ca/~awolsp/>
<http://www.bok.net/~paour/VirtualF/>

Aanpassen van de Scherm Geometrie -- Dit was onze "instinker" (hoewel het gebruik van logica nog steeds legaal is in de meeste landen, dus je had kunnen weten dat alle antwoorden juist zijn zodra je je realiseerde dat minstens twee van de andere correct waren). Met het aanpassen van de scherm geometrie bedoelen we het draaien aan de knoppen van de horizontale en verticale afmetingen op het beeldscherm om de zwarte rand rond het computerbeeld groter of kleiner te maken. Op veel schermen kan een centimeter of meer aan zwart worden weggehaald van de boven- onder- en zijkanten van het beeldscherm, wat in essentie de fysieke afmetingen van het beeld vergroot.

Het groter maken van het beeld op je beeldscherm om de zwarte randen te elimineren heeft het directe voordeel dat de grootte van de pixels (maar niet het aantal) toeneemt, waardoor de afbeelding van het bureaublad die je al hebt groter wordt en gemakkelijker wordt voor de ogen. Dat maakt het wellicht mogelijk een stapje groter in de resolutie te gaan (wat het aantal pixels groter maakt) en omdat een hogere resolutie het mogelijk maakt meer informatie tegelijk te zien, kan het het effect hebben de productiviteit te verhogen.

Deze truuk werkt alleen op beeldschermen met een beeldbuis, niet op schermen die op LCD zijn gebaseerd, aangezien deze alle beschikbare pixels altijd al gebruiken. De reden dat het werkt is dat de electronenbundel die de pixels tekent op het scherm aangepast kan worden om de fosfor in de anders donkere randen op te laten lichten. Wel, als dit zo'n geweldige truuk is, kun je je afvragen waarom de zwarte rand er eigenlijk is. Het antwoord ligt in het nadeel van het groter maken van het plaatje op je beeldscherm - het vergroten van het beeld en het daarbij behorende verplaatsen van het beeld, en het elimineren van de vertekeningen (waar de randen niet exact parallel zijn, of waar ze naar binnen of naar buiten buigen) zullen waarschijnlijk het beeld vertekenen. Is dat te zien? Misschien, maar tenzij je een grafische gebruiker bent van je Mac en je bewust bent van de precisie van de afmetingen van een plaatje, kan dat je waarschijnlijk niet veel schelen. Persoonlijk vind ik dat de voordelen van de grotere afmetingen opwegen tegen de nadelen van de licht vertekende pixel afmetingen.

De aanpassingen doen kost een paar minuten uitproberen, wellicht voorafgegaan van het lezen van de handleiding van het beeldscherm. (Voor de lezers met een iMac, de knoppen zijn allemaal in software aanwezig in het Beeldschermen regelpaneel.) De belangrijke knoppen zijn meestal van een label voorzien (afkortingen komen veel voor) als Horizontal Size en Vertical Size (en soms Zoom), met daarnaast Horizontal Position en Vertical Position. Maak eerst de horizontale afmetingen zo groot dat zoveel van je scherm als mogelijk gevuld is. Echter, het midden van het beeld is vaak niet gecentreerd, dus meestal moet je ook de horizontale positie bijstellen. Doe daarna hetzelfde met de vertikale afmetingen en positie. Nadat je de afmetingen aangepast hebt, kijk naar de randen van het beeld. Zijn ze concaaf of convex, of niet netjes parallel, gebruik de geometrie knoppen (welke een grote variate aan namen kunnen hebben) om de randen recht te maken, het beeld te roteren, en de randen parallel te maken.

Je beeldscherm hoort deze instellingen vast te houden, hoewel ik ze heb zien verlopen over lange periodes, dus als je iets ziet dat niet helemaal goed eruit ziet, gebruik de instellingen om ze terug te zetten op de manier waarop je het het prettigst vindt. En geef deze informatie - zowel de instructies over het weghalen van de ongebruikte zwarte randen als de stukken over scherm resolutie, meer schermen, en virtuele schermen - vooral door aan minder ervaren gebruikers die hun voordeel kunnen doen met een net iets groter beeld of de grotere resolutie die het mogelijk maakt.


Woorden zijn goedkoop - ViaVoice Enhanced Edition

door Matt Neuburg <[email protected]>
[vertaling: TK, MV, LmR, PEP, AV]

[Opmerking: Met dank aan mijn vader, Ned Neuburg, die lid was van het ARPA-bestuur in de jaren '70 voor zijn technische ondersteuning; en Erik Sea, Development Lead bij IBM voor ViaVoice/Mac, voor zijn hulp bij enkele belangrijke vragen.]

Over het algemeen gingen de klassieke science-fiction verhalen zowel niet ver genoeg als te ver in hun voorspellingen over computers. Dat computers in de toekomst krachtiger zouden worden lag voor de hand, maar slechts weinigen konden voorspellen dat computers ook klein, goedkoop, en alomtegenwoordig zouden worden, met alle belangrijke sociologische gevolgen van dien. Anderzijds zouden we nu volgens die verhalen al lang met onze computers moeten spreken. Maar waar is HAL 9000? Het QWERTY-toetsenbord is een onhandige antiquiteit; uiteindelijk zou je computer natuurlijk je gedachten moeten lezen, maar waarom kan je hem intussen gewoon niet zeggen wat hij moet doen? Welnu, voor veel opdrachten is dit al mogelijk; een uiterst belangrijke opdracht aan een stemgestuurde computer toevertrouwen is nog niet echt aan te bevelen, maar anderzijds is je computer ook niet meer bepaald doof.

Spaakerkenning -- Je hebt waarschijnlijk al wel gehoord van ARPA, de afdeling voor geavanceerd onderzoek van het Ministerie van Defensie van de V.S. tijdens de Koude Oorlog. Eén van hun uitvindingen ken je zeker, nl. het Internet. In een ander project van ARPA werd gewerkt aan computers die zouden begrijpen wat de gebruiker zegt - de zogenaamde "spraakherkenning". (ik heb ooit eens de term "autoglossomerolyse," voorgesteld, maar om de een of andere reden sloeg dit niet aan.) In de vroege jaren '70 werden er door ARPA in het kader van dit project enorme bedragen tegenaangegooid.

De grootste hindernis was het akoestische model, wat best kan worden uitgelegd als een analyse van fonemen. Hoe kan een computer nu weten of een klinker "aa" of "ie" is, of een medeklinker "p" of "t" is, of zelfs waar de grens van een foneem ligt? De meeste onderzoekers werkten aan dit probleem met de idee dat computers de kenmerken van spraak zouden vinden, zoals hoe de mond klanken produceert: "dit is een stemhebbende gutturale stop, dat is een geronde voorklinker". Het onderzoek van ARPA toonde echter aan dat je veel meer vooruitgang kon boeken door breder te werk te gaan. Eerst en vooral ken je een minimum aantal kenmerken toe aan de ruwe klank; vervolgens vergelijk je die nummers met een sjabloon - deze klank is bijvoorbeeld een "p" omdat hij er numeriek uitziet als een vooropgenomen "p".

Hierbij is het belangrijkste het begrip "uitzien als". James Baker, die toen net was afgestudeerd van Carnegie-Mellon University, paste een probabilistisch mathematisch model toe op het vergelijken van spraakherkenningspatronen, het zogenaamde "hidden Markov model" (HMM). De resultaten in die eerste financieringsronde van ARPA bleken zo superieur dat alle moderne spraakherkenning gebruik maakt van HMM, wat ons om twee redenen moet verbazen. Ten eerste is HMM fundamenteel niet alleen onnauwkeurig, maar ook bijna zeker verkeerd - onze oren en hersenen mogen dan wel spraak horen en analyseren, maar HMM doet dit zeker niet. Ten tweede is het verrassend dat we al zo lang op dezelfde manier aan spraakherkenning doen. Het moderne HMM is inderdaad veel meer ontwikkeld dan het oorspronkelijke model; bovendien mag je zeker het belang van software-optimalisering niet onderschatten, een richting waarin diezelfde James Baker, die later Dragon Systems oprichtte, een pioniersrol heeft gespeeld. Maar de belangrijkste ontwikkeling is zeker in hardware. Onze huidige computers zijn ongeveer duizend keer sneller, duizend keer krachtiger, en duizend keer kleiner en goedkoper dan de computers van in de beginperiode van het onderzoek, zodat zij nu eindelijk de mathematische vereisten van spraakherkenning min of meer aankunnen.

<http://www.dragonsystems.com/about/>

In het begin van de jaren '90 creëerde Apple een eigen component voor spraakherkenning op systeemniveau, PlainTalk. Maar het ingenieuze van PlainTalk ligt in de compromissen: het vereist geen training voor een bepaalde gebruiker, maar het werkt alleen met discrete spraakherkenning, waarbij een korte zin wordt vergeleken met een eindige lijst van voorgedefinieerde mogelijkheden. De heilige graal is continue spraakherkenning (CSR), waarbij de gebruiker spreekt en de computer deze spraak onmiddellijk omzet in tekst. CSR is er wel degelijk, dankzij ViaVoice Enhanced Edition van IBM.

<http://www-4.ibm.com/software/speech/mac/newmac/>
<http://www-4.ibm.com/software/speech/support/faqmacenh.html>

Welkom CSH -- Ondanks HAL 9000 zijn er zware hindernissen op weg naar continue spraakherkenning, zoals het verloop van IBM's onderzoek laat zien. Ze begonnen er al in de jaren 50 mee en waren een van de eersten die subsidie van ARPA ontvingen; toch brengt IBM pas sinds een jaar of vijf een voor de consument bestemd dicteerprogramma op de markt. Vergeet niet dat het akoestische model je fonemen moet herkennen terwijl deze vaak schuil gaan in een aaneenschakeling van woorden en het accent op bepaalde zinsdelen. Maar anders dan in discrete spraakherkenning is je "opdracht" nooit duidelijk afgerond, dus moet het akoestische model ook nog eens zo snel zijn dat het je kan bijhouden. Het is bovendien niet het enige model dat een rol speelt: er moet een taalkundig model zijn om woorden te vormen uit je fonemen. En die woordenlijst is niet zo'n kleintje want omvat een vocabulaire van tienduizenden woorden.

<http://www.research.ibm.com/hlt/html/history.html>

Zo vereist de huidige spraakherkenning een akoestisch model dat geoefend kan worden in alle eigenschappen van een bepaalde stem, uitspraak, microfoon en omgeving om enigszins van nut te zijn. ViaVoice pakt dit aan door je een aantal verhaaltjes te laten voorlezen als je het programma voor de eerste keer gebruikt. (Je kunt deze procedure later herhalen om jouw model te verfijnen. ViaVoice bewaart afzonderlijke modellen zodat het programma door meer mensen gebruikt kan worden.) Het taalkundig model intussen heeft een woordenboek nodig. Een gewoon woordenboek is inbegrepen en aannemelijk is dat ViaVoice in eerste instantie je uitspraak herkent aan je eigen akoestische model; daarnaast zijn bijzondere woordenboeken inbegrepen zoals over koken en geldzaken, waarvan er op enig moment een in gebruik kan zijn.

Toch zal het duidelijk zijn dat ViaVoice onmogelijk elk woord dat je zegt herkent, dus zorgt het voor drie aanvullingen om je modellen uit te breiden en te verfijnen:

Ook breidt ViaVoice je woordenschat uit door middel van macro's en opdrachten. Macro's zijn uitdrukkingen die anders gespeld dan uitgesproken worden, zoals leestekens ("komma" en "punt") en termen als "[email protected]" (waarvan de uitspraak zou kunnen luiden: "mijn email adres"). Macro's kunnen regels bevatten voor wisselwerking met hun omgeving; op die manier zorg je bijvoorbeeld ervoor dat een punt aan het voorafgaande woord vastzit, gevolgd wordt door een spatie, en dat het volgende woord met een hoofdletter begint. Voeren de macro's het typewerk uit, de opdrachten zorgen voor alle andere handelingen. Opdrachten zijn grotendeels ingebouwd en hun beschikbaarheid hangt af van hoe je het programma op dat moment gebruikt.

Het zijn er zeven -- ViaVoice's functionaliteit is verdeeld over zeven grote applicaties (en een stuk of wat kleinere). Dit klinkt ingewikkeld maar de implementatie ervan is dat niet: "packages" (op slot gezette mappen) verbergen de diverse applicaties in de Finder en ze starten op of sluiten af al naar gelang ze nodig zijn. In de beschrijving die volgt zal ik bij benadering aangeven hoeveel RAM er nodig is met het virtuele geheugen uitgeschakelt omdat ViaVoice zo veel sneller is.

Je begint een sessie door SpeakPad te openen (12 MB); dit start de Background Engine op (3 MB, onzichtbaar) en VoiceCenter (3 MB).

VoiceCenter verschijnt als een vensterachtig ding dat steeds boven alle andere applicaties blijft zweven en is het commandocentrum voor het gehele ViaVoice. Het bevat een aantal knoppen en een pop-up menu en dit is ook waar je de microfoon aan- en uitschakelt en je macro's en akoestische modellen regelt. Bovendien bevat dit ook je correctievenster.

SpeakPad lijkt op een gewone tekstverwerker maar het accepteert gesproken woorden en reageert op diverse gesproken commando's aangaande cursorselectie en -beweging, knippen en plakken en dergelijke. Omdat je het correctievenster ook met je stem kan regelen, kan een dicteersessie geheel zonder handen plaatsvinden, als je maar geduld hebt. Bovendien is SpeakPad scriptable en heeft ViaVoice en fantastische functie die lijkt op PlainTalk: je kan je set van commando's uitbreiden met AppleScripts, waarbij een script wordt aangesproken zodra je de naam ervan noemt. Ik gebruik het om ViaVoice meer en beter te laten werken met en als andere programma's. Voorbeeld: bij het schrijven van deze recensie heb ik delen ingesproken met SpeakPad en toen gezegd "Verplaats naar Nisus" om een zelfgemaakt script aan te roepen dat de tekst van SpeakPad kopiëert en in Nisus Writer plakt.

Buiten SpeakPad kan je ook dicteren in Microsoft Word, Internet Explorer, Outlook Express of AppleWorks. Om deze functie te gebruiken start je de Direct Dictation applicatie op (1 MB, onzichtbaar), die zowel de Dictation Manager aanroept (4 MB, onzichtbaar) als de Background Engine en VoiceCenter als die niet al aanstaan. Zodra VoiceCenter boven bijvoorbeeld Microsoft Word zweeft kan je de microfoon aanzetten en zeggen "Begin direct dictation" en je woorden worden in Word getypt..

Om het geluidsniveau van je microfoon in te stellen en hem te testen op achtergrondgeluiden draai je Setup Assistant (9 MB), een enkelvoudig venster dat bestaat uit diverse panelen waar je doorheenbeweegt door middel van pijlknoppen. Je gebruikt Setup Assistant ook om je documenten te analyzeren of om een stemmodel aan te maken. Dit doe je wel met verschillende sets van panelen. Met ViaVoice Settings (6 MB), dat eruit ziet als een regelpaneel-achtig venster, stel je de gebruiker en het stemmodel in. Hierin is het ook mogelijk om je macro's en vocabulaire te regelen; ook hier weer steeds met een ander venster. Elk van deze programma's sluit zelf af als je het venster sluit.

Ik kom hier om CSR te begraven...Vanaf de installatie vond ik ViaVoice vol foutjes, bizar en domweg irritant. Op één van mijn computers weigerde het te installeren; op de andere computer kreeg ik het wel geïnstalleerd maar crashte het zodra ik mijn akoestische model wilde opbouwen. Niet voor één gat te vangen installeerde ik het dus op de tweede computer en kopiëerde het naar de eerste computer, waar het perfect werkt; daar bouwde ik mijn model op en kopiëerde die gegevens terug naar mijn tweede computer. Direct Dictation crasht ook daar (de beide crashes zijn te wijten aan de zeer machine-technische manier waarop ViaVoice wil voorkomen dat je computer de slaapstand ingaat terwijl je dicteert); maar Direct Dictation mis ik niet aangezien dit toch een lastige functie is - 't is veel trager dan het dicteren met gebruik van SpeakPad en ViaVoice vergeet wel erg makkelijk de plek waar je bent gebleven in een document.

Terwijl je een verhaaltje voorleest om je akoestische model op te bouwen zorgt ViaVoice ervoor dat het woord waarmee de computer denkt dat je bezig bent wordt gehighlight, maar als eenmaal het verkeerde woord wordt gehighlight is het niet meer te achterhalen wat het systeem van je wil. Voorkeuren die je instelt zijn soms al vergeten voor je de OK knop bereikt. Na gebruik van Direct Dictation krijgt je toetsenbordmenu de setup van het verkeerde toetsenbord. Vaak wil de microfoon het niet doen of ViaVoice weigert er een eind aan te draaien. Als je dicteert met veel geselecteerde tekst krijg je een dialoog venster dat vraagt of je werkelijk de selectie wilt overschrijven; als je dan ja zegt verschijnen de door jou gedicteerde woorden achterstevoren!

SpeakPad eist het recht op zelf de hoofdletters aan te brengen en de spaties te plaatsen en maakt hierbij voortdurend fouten. Als in een mysterie verschijnen er overbodige spaties en verdwijnen er andere juist gewenste tekens. Als je een punctuatie aangeeft zorgt dit ervoor dat enkele daaraan voorafgaande woorden verdwijnen uit het typewerk. Kleine werkzaamheden als dubbel-klik-en-sleep opdrachten werken niet naar behoren. Je krijgt geen inzicht in de meegeleverde woordenboeken dus je kunt niet van tevoren de door jou vereiste woorden opgeven: je moet wachten tot ViaVoice een fout maakt.

ViaVoice bevat om te beginnen 80 MB schijfruimte en honderden bestanden waarvan je het doel onbekend blijft; daarna groeit de Temp map en groeit en groeit (ik hoor dat hij pas wordt opgeruimd als het volume 250 MB bedraagt). De handleiding is pover, lelijk en geeft weinig informatie; de commando referenties zijn onjuist en onvolledig. Samengevat, dit is een star, gigantisch programma dat je hele computer overneemt, een slecht ontwerp vertoont, weinig begrip heeft van de Mac interface en gebruiken, en het heeft er geen idee van hoe de gebruiker ermee wil werken.

...en om het aan te prijzen -- Toch lijkt het in werking zien van ViaVoice niets meer dan een wonder. Tenzij je natuurlijk vreselijk naïef, jonger dan 12, of met science fiction opgevoed bent. Je praat en wauw, woorden verschijnen op het scherm - meestal zelfs de juiste woorden! Natuurlijk heeft de herkennings engine zijn beperkingen, maar hier hebben alle herkennings engines tot nu toe last van. Bijvoorbeeld, ondanks de meesterlijke voorbeelden van correct herkende homoniemen ("Write the right letter to Mr. Wright"), maakt ViaVoice regelmatig fouten die zelfs iemand met geen greintje grammaticale of syntactische kennis zou maken. Dit simpelweg omdat het zulke kennis niet heeft: het kent sommige waarschijnlijke contexten voor sommige woorden, maar het kent geen Engels. Bovendien, zo legt mijn vader het uit, is het grootste probleem bij spraakherkenning dat als het fout gaat de computer niet uit kan leggen waarom ("spreek luider / langzamer", of wat dan ook). Dit om de simpele reden dat het programma het niet weet: de modellen zijn automatisch en voorspellend, we kunnen ze construeren en samen laten werken, maar we weten niet precies hoe ze eigenlijk werken (zoals HAL 9000!).

Voor verhoogde accuraatheid, zijn sommige voorzorgsmaatregelen behulpzaam. Als je voor het eerst je akoestische model traint, lees dan voldoende materiaal en gebruik dezelfde intonatie als waarin je zult dicteren. Ik vond een neutrale monotone intonatie het beste werken (zoals HAL 9000!). Doe iedere keer dat je ViaVoice opstart de audio set-up; dit vraagt niet meer dan een minuutje. Als ViaVoice fouten maakt, corrigeer het dan, dat is namelijk hoe het leert. Tenslotte, laat ViaVoice jou trainen: je moet continu spreken maar niet te snel, natuurlijk maar niet slordig, voorzichtig maar niet overdreven - als je bijvoorbeeld je laatste medeklinker forceert, zal ViaVoice geen duidelijker medeklinker horen maar een extra woord. Onthoud dat het slechts een machine is!

Misschien was voor mij nog wel het moeilijkste om te leren dicteren. Als ik begin te praten heb ik meestal maar een vaag idee van wat ik wil gaan zeggen. Ik verslik me dus nogal snel onder de druk van improviseren om een constante stroom van duidelijke, langzame en goed gevormde zinnen te maken. Het is een goede oefening om hardop te lezen, heb ik uitgevonden. Een van mijn beste gebruiken voor ViaVoice was het overtikken van oude handgeschreven brieven. Ik gebruik het echter ook om e-mail berichten te maken en ik heb het ook gebruikt om een klad van dit artikel te maken.

Het laatste woord -- Computer spraakherkenning is hier en nu, en alhoewel ik niet wil voorspellen hoe, geloof ik dat het alles zal veranderen. Misschien zullen sommige veel voorkomende fouten van spraakherkennings homoniemen standaard spelling worden. Misschien wordt de invoer voor computers binnenkort wel een hybride van muis, toetsenbord en stem. In elk geval zijn we nu aan het begin van een nieuw tijdperk, een ieder die wil kan eroverheen stappen en de eerste voet plaatsen. Nu - open de deuren alsjeblieft, HAL.

ViaVoice Enhanced vereist Mac OS 9.0.4 en een Power Mac G3/300 of beter; hoe sneller de processor en hoe meer RAM, hoe beter - maar dit zal alleen snelheid verbeteren, niet precisie. Het kost $130 en komt met een Andrea USB headset, maar elke goede microfoon is goed, zoals de iParrott of de Andrea PlainTalk headset welke met de vorige versie kwam.

<http://www.macsense.com/Product/iParrott103_b.html>

Als je computer niet aan de vereisten voldoet, kun je misschien de vorige versie proberen, ViaVoice Millennium. Die is niet zo goed, maar werkt goed genoeg, vereist slechts Mac OS 8.5.1 en minimaal een Power Mac G3/233, en met de prijs van $75, wat niet meer is dan de waarde van de meegeleverde headset, moet je het als een koopje zien.


Niet-winstgevende en niet-commerciële publicaties en Websites mogen artikels overnemen of een HTML link maken als de bron duidelijk en volledig vermeld wordt. Anderen gelieve ons te contacteren. We garanderen de precisie van de artikels niet. Caveat lector. Publicatie-, product- en firmanamen kunnen gedeponeerde merken zijn van hun ondernemingen.

Vorige aflevering | Search TidBITS | TidBITS Homepage | Volgende aflevering