Asimmetrie sensoriali
Wednesday, 18 October 06
Qualunque tentativo di integrare la voce nelle applicazion web e' fino ad oggi (e che io sappia, ma la tecnologia c'e' e i siti con la voce non ci sono dunque...) fallito. Non e' una sorpresa, e a parte i non vedenti, nessuno ha perso niente da questa mancata integrazione, ci abbiamo solo guadagnato.
Al contrario la voce usata per pilotare device portatili (come input di questi insomma), continua a riscuotere un successo sempre maggiore. Puo' sembrare strano perche' qualche anno fa c'e' stato il boom dei programmi per la dettatura automatica, ma vuoi perche' la tecnologia non era totalmente matura e parlando in maniera naturale non e' che la cosa funzioni benissimo, vuoi perche' la tastiera e' un mezzo estremamente comodo di input e non ci si stanca come utilizzando la voce, alla fine non se ne e' fatto molto mi pare.
Sui device portatili pero' la cosa e' diversa: serve inserire del testo ma non hanno una vera tastiera, e molto spesso non si e' alla scrivania. Inoltre la maggior parte delle volte non si vuole dettare ad un telefonino la divina commedia, ma un testo breve per cui non ci si stanca. Il risultato e' che la voce come mezzo di input di piccoli device portatili potrebbe completamente modificare l'uso che ne facciamo.
Il mio N70 e' ad esempio in grado di comporre il numero di una persona presente nella rubrica senza alcuna fase di traning. Ha un sintetizzatore vocale interno che usa per generare il suono del nome, e tenta di fare il match con questo. La cosa funziona benissimo: il telefono sbaglia raramente (quasi mai) e non devo preoccuparmi di dettargli i nomi di tutte le persone che chiamo spesso.
Ma e' troppo poco, bisognerebbe andare oltre. Ad esempio la voce come strumento per immettere gli SMS sarebbe eccezionale: Ciao Gina non ti ho potuto chiamare perche' sono occupato, ci sentiamo questa sera: 2 secondi con la voce, 15 con i tasti e il T9. Non parliamo poi della TODO list... telefono memorizza: arance limoni salsa di soia riso broccoletti.
L'idea di attivare il device con un prefisso, tipo "telefono" o qualcosa che collide di meno con il linguaggio reale mi piace moltissimo (star trek docet).
Qualcuno potrebbe dire che la TODO list funziona bene gia' con i software per prendere appunti vocali, che non hanno tra l'altro problemi di riconoscimento e sono gia' disponibili per gli smart phones. In realta' sono scomodi perche' c'e' una forte asimmetria tra l'input e l'output comodo: e' bello inserire con la voce, ma ricevere le informazioni come suono e' scomodo.
Se hai una bella lista della spesa sul display:
- Scorri ogni punto della lista con il cursore. Decidi tu quanto tempo soffermarti su ogni parte. La voce invece continua con i suoi tempi. Ti tocca rifare il play ogni volta che hai preso una nuova cosa al supermercato (per continuare con l'esempio di poco fa) perche' magari hai gia' dimenticato le altre.
- E' invasivo: vicino a delle persone non hai alcun problema a leggere dal display e non dai alcun fastidio. Al contrario per ascoltare ti serve che ci sia relativo silenzio, disturbare, o indossare un auricolare.
- Non puoi spedire cio' che hai immesso come testo. Un dato sonoro la cui importanza e' unicamente il contenuto in parole e' uno spreco enorme in termini di spazio.
- Non puoi usare tecnologie evolute che sullo smart phone siano in grado di (ad esempio) analizzare il testo da te immesso e avvisarti che i limoni li hai gia' comprati ieri.
Al contrario la voce usata per pilotare device portatili (come input di questi insomma), continua a riscuotere un successo sempre maggiore. Puo' sembrare strano perche' qualche anno fa c'e' stato il boom dei programmi per la dettatura automatica, ma vuoi perche' la tecnologia non era totalmente matura e parlando in maniera naturale non e' che la cosa funzioni benissimo, vuoi perche' la tastiera e' un mezzo estremamente comodo di input e non ci si stanca come utilizzando la voce, alla fine non se ne e' fatto molto mi pare.
Sui device portatili pero' la cosa e' diversa: serve inserire del testo ma non hanno una vera tastiera, e molto spesso non si e' alla scrivania. Inoltre la maggior parte delle volte non si vuole dettare ad un telefonino la divina commedia, ma un testo breve per cui non ci si stanca. Il risultato e' che la voce come mezzo di input di piccoli device portatili potrebbe completamente modificare l'uso che ne facciamo.
Il mio N70 e' ad esempio in grado di comporre il numero di una persona presente nella rubrica senza alcuna fase di traning. Ha un sintetizzatore vocale interno che usa per generare il suono del nome, e tenta di fare il match con questo. La cosa funziona benissimo: il telefono sbaglia raramente (quasi mai) e non devo preoccuparmi di dettargli i nomi di tutte le persone che chiamo spesso.
Ma e' troppo poco, bisognerebbe andare oltre. Ad esempio la voce come strumento per immettere gli SMS sarebbe eccezionale: Ciao Gina non ti ho potuto chiamare perche' sono occupato, ci sentiamo questa sera: 2 secondi con la voce, 15 con i tasti e il T9. Non parliamo poi della TODO list... telefono memorizza: arance limoni salsa di soia riso broccoletti.
L'idea di attivare il device con un prefisso, tipo "telefono" o qualcosa che collide di meno con il linguaggio reale mi piace moltissimo (star trek docet).
Qualcuno potrebbe dire che la TODO list funziona bene gia' con i software per prendere appunti vocali, che non hanno tra l'altro problemi di riconoscimento e sono gia' disponibili per gli smart phones. In realta' sono scomodi perche' c'e' una forte asimmetria tra l'input e l'output comodo: e' bello inserire con la voce, ma ricevere le informazioni come suono e' scomodo.
Se hai una bella lista della spesa sul display:
- Scorri ogni punto della lista con il cursore. Decidi tu quanto tempo soffermarti su ogni parte. La voce invece continua con i suoi tempi. Ti tocca rifare il play ogni volta che hai preso una nuova cosa al supermercato (per continuare con l'esempio di poco fa) perche' magari hai gia' dimenticato le altre.
- E' invasivo: vicino a delle persone non hai alcun problema a leggere dal display e non dai alcun fastidio. Al contrario per ascoltare ti serve che ci sia relativo silenzio, disturbare, o indossare un auricolare.
- Non puoi spedire cio' che hai immesso come testo. Un dato sonoro la cui importanza e' unicamente il contenuto in parole e' uno spreco enorme in termini di spazio.
- Non puoi usare tecnologie evolute che sullo smart phone siano in grado di (ad esempio) analizzare il testo da te immesso e avvisarti che i limoni li hai gia' comprati ieri.
Do you like this article?
Subscribe to the RSS feed of this blog or use the newsletter service in order to receive a notification every time there is something of new to read here.
Note: you'll not see this box again if you are a usual reader.
Subscribe to the RSS feed of this blog or use the newsletter service in order to receive a notification every time there is something of new to read here.
Note: you'll not see this box again if you are a usual reader.