wantee Thesis

Transcription

wantee Thesis
Interaction Design
wantee
Bachelor Thesis
Tobias Koller
[email protected]
Mentoren : Karmen Franinovic, Gerhard M. Buurman
Interaction Design Program
FS 2010
Zurich University of the Arts
0.0 Inhaltsverzeichnis
1. Einleitung
2. Hintergrund-Recherche
2.1 Projekte in Planung
2.2 Bestehende Produkte und Lösungen
2.3 Interfaces & Textinput
3. Kontext-Recherche
3.1 Nutzer-Befragung und Analyse
3.2 Moodboard
3.3 Funktionsumfang des Browsers
3.4 Gestik als Inputmethode
3.5 Anforderungen an das Interface
4. Tests und Experimente
4.1 On-Screen-Keyboard
4.2 Keyboard-Trackball-Kombination
4.3 Adobe-Air-basierter Browser
4.4 Touchpad
4.5 Pen & Tablet, Handschriftenerkennung
5. Das wantee-Konzept
5.1 Wahl des Interfaces
5.2 Zuordnung der Gesten & Funktionen
5.3 Bedienung von wantee mittels Pen & Tablet
5.4 Bedienung von wantee mittels Toucheingabe
5.5 Areas
5.6 Hauptmodule
5.7 Hilfsmodule
6. Der wantee-Prototyp
7. Evaluation
7.1 Testpersonen
7.2 Pen & Tablet
7.3 Gesten
7.4 Texteingabe mittels Pen
7.5 Buttons
7.6 Schriftgrösse
8. Finaler wantee-Prototyp
9. Fazit
10. Anmerkungen
11. Quellenverzeichnis
11.1 Weblinks
11.2 Literaturverzeichnis
12. Anhang
1.0 Einleitung
Kurzbeschrieb
wantee vereint Web & TV, ist mittels Gesten steuerbar und ermöglicht ein komfortables
gemeinsames Erlebnis unterschiedlichster Medieninhalte in angenehmer Umgebung…
Thematik
wantee ist vor dem Hintergrund des “Web in the World”, also wie das Web an sich in das
alltägliche Leben integriert ist oder sein könnte, entstanden. Generell durchdringen das
Web, Inhalte daraus oder auch Verknüpfungen ins Web immer stärker den Alltag, bis auf
wenige Ausnahmen trifft dies aber nicht auf den Bereich des TV zu. Die grundlegende
Frage für das Konzept hinter wantee war also, warum das Web bis anhin nicht auf den
Fernseher gekommen ist, wofür wantee sowohl Antworten als auch Lösungen bieten
soll.
Zur Namensgebung
Das Konzept respektive der Prototyp trägt den Namen “wantee“, welcher eine lautmalerische Verbindung der Wörter “Web and TV“ ist und im englischen Slang auch
“etwas, das man gerne hätte“ bedeutet.
Zu dieser Arbeit
Zugunsten der Gliederung wurde nicht auf einen stringenten zeitlichen Ablauf, wie er
in realität bei diesem Projekt passiert ist, geachtet. Es kann deshalb sein, dass im Text
Schlussfolgerungen Aufgrund von Experimenten etc. gezogen werden, welche erst
später in dieser Arbeit erwähnt werden.
2.0 Hintergrund-Recherche
2.1 Projekte in Planung
Google TV
Google plant in Kooperation mit Intel, Sony und weiteren TV-Produzenten das Web
über den Fernseher ins Wohnzimmer zu bringen (vgl. Web06, Web07, Web12). Dies soll
einerseits über spezielle Set-Top-Boxen, andererseits über neu entwickelte TV’s geschehen und auf Googles Android basieren. Die Interface-Hardware hierzu soll von Logitech
entwickelt werden, wobei gerüchteweise von QWERTY-Fernbedienungen die Rede ist,
also von Fernbedienungen mit einer (kleinen?) Tastatur. Welche Form diese genau haben
sollen ist zum momentanen Zeitpunkt jedoch nicht bekannt.
Auch nicht bekannt ist, wie das System von Google genau funktionieren soll, ob ähnlich
wie bei anderen Projekten (vgl. auch Yahoo! Connected TV, Cello TV) Widgets zum
Einsatz kommen sollen oder ob eher eine Variante des Google-Browsers “Chrome“ im
Verbund mit Online-Applikationen und Cloud-Computing als Basis für die Einbindung
des Internets benutzt werden soll.
Hierbei besonders interessant für meine Arbeit erscheint mir, dass Google davon ausgeht, dass immer mehr Leute Internet auf ihren TV’s nutzen wollen, zumindest so viele,
dass sich für Google ein lukratives Werbegeschäft aufzutun scheint.
Windows 7 Embedded
Windows 7 soll als “Windows Embedded Standard 7” bald für diverse Geräte wie Fernseher oder Settop-Boxen zur Verfügung stehen (vgl. Web01). In Win Embedded sollte
auch der Internet Explorer integriert sein, was eigentlich die Möglichkeit des Browsens
auf dem TV eröffnen könnte. Wie dies auf einem TV genau geschehen soll ist aber momentan nicht eruierbar. Ein aktuelles Demonstrationsvideo(vgl. Web02) auf einem Fernseher zeigt Menüpunkte wie “Internet TV” und “Internet Media” auf, welche aber alle nur
den Zugriff auf TV-affine Inhalte erlaubt. Im Video ist zwar auch ein Internet Explorer-Icon
zu sehen, leider wird dieser jedoch nicht gestartet. Was für eine Art Interface verwendet
wird ist ebenfalls nicht ersichtlich.
Laut einer Medienankündigung wird es bald Windows-7 zertifizierte Fernseher von
Toshiba geben (vgl. Web03). Sie bieten Full-HD-Bildschirm mit einer LAN-Schnittstelle
(der WWW-Anschluss ist also gegeben) und zwei USB-Ports. Einen Steckplatz belegt
ein USB-Funkadapter, über den der Fernseher zum Beispiel Videos vom Computer
empfängt und wiedergibt. Dies soll mittels dem “Toshiba Media Controller” geschehen,
welcher Multimediainhalte via DLNA vom PC auf den TV bringt. Leider ist aber auch
bei dieser Ankündigung von einem auf dem TV benutzbaren Browser nichts Konkretes
in Erfahrung zu bringen.
2.2 Bestehende Produkte & Lösungen
Yahoo! Connected TV
Die Lösung von Yahoo, um das Internet zumindest teilweise auf den Fernseher zu bringen, besteht aus Widgets (vgl. Web05). Diese können partiell Informationen aus dem
Web darstellen oder verlinken auf TV-ähnliche Inhalte. Ein wichtiger Punkt ist hierbei,
dass vor allem auch auf TV On Demand von beispielsweise “Amazon Video on Demand“
und “Blockbuster“ gesetzt wird. Aus meiner Sicht sind dies nette Features zur Erweiterung der TV-Funktionalität, aber noch meilenweit von einer Internet-Experience auf dem
TV entfernt.
Cello TV
Der englische TV-Hersteller Cello Electronics hat einen Fernseher entwickelt, mit welchem
man über einen integrierten Netzwerkanschluss Zugriff auf “iPlayer”, die Online-Mediathek von BBC, hat (vgl. Web08). Auch Dienste von anderen Anbietern wie YouTube,
Disney etc. können direkt genutzt werden. Ein beliebiger Zugriff aufs Internet scheint
aber nicht möglich zu sein, zudem sind auch hier die Inhalte eher TV- als Web-orientiert.
Scandinavia
Eine Firma namens “People of Lava (Sweden)” hat einen auf Googles Android-OS basierenden TV vorgestellt, welcher TV, Internet, Multimedia und Social Media in einem
bieten soll(vgl. Web04). Auf ersten Bildern ist auch konkret eine Art Browser mit einer
aufgerufenen Webseite zu sehen. Der Browser würde somit die folgenden Navigationspunkte direkt anwählbar einblenden: Suchen, Bookmarks, neues Fenster, Refresh,
Forward (aber kein Back ?) und Home. Als Interface wird in den Spezifikationen ein
Wireless-Keyboard mit Pointer/Maus angegeben, detaillierte Informationen dazu sind
jedoch nicht auffindbar. Das System scheint App-basiert zu sein, d.h. der Browser ist
ein App, ebenso wie Youtube, Google-Maps etc. Zudem scheinen auch Widgets für
Wetterdaten etc. installiert zu sein. Da aber kein Video dazu aufzutreiben ist und der TV
anscheinend auch noch nicht gekauft werden kann stellt sich mir die Frage, ob es sich
bei den Produktbildern (inkl. Browser) eventuell nur um Fotomontagen handelt.
Phillips Net-TV
Phillips bietet bereits internetfähige TV’s an, in welche W-LAN und ein auf Opera basierender Browser integriert sind (vgl. Web09). Dieser kann dank CE-HTML speziell TV
angepasste Inhalte, aber auch normale Webseiten anzeigen, wobei diese aber standardmässig im Mobile-Modus aufgerufen werden. Navigiert wird mittels einer Fernbedienung, Textinput wird in SMS-Manier über ein 12-stelliges Tastenfeld eingegeben, was
die Bedienung des Browser etwas umständlich und langsam macht.
2.0 Hintergrund-Recherche
2.2 Bestehende Produkte & Lösungen
Sony Playstation 3
Die Playstation 3 von Sony beinhaltet einen relativ vollständigen Browser (vgl. mein Test
des Playstation-Browsers, Web10 ). Dieser lässt das Aufrufen beliebiger Webseiten zu
und kann auch Flash-Content darstellen. Bedient wird er über das Standard-PlaystationGamepad, wobei mittels des einen Joysticks (oder der Richtungstasten) ein Mauscursor
gesteuert und mittels des zweiten Joysticks der Content verschoben (gescrollt) werden
kann. Ein Klick auf Links wird mittels der X-Taste ausgelöst. Die Texteingabe wird mittels
eines Klicks in ein Eingabefeld gestartet und ruft ein Tastaturfeld auf, welches ebenfalls
mittels des Joysticks bedient wird, indem man Ziffer für Ziffer ansteuert und sodann
durch einen Klick auf die X-Taste die entsprechende Ziffer in eine Textzeile übernimmt.
Ist der Text vollständig eingegeben, wird er über einen “Einfügen“-Button in das Eingabefeld im Browser übertragen und kann dann verwendet werden. Dieses System funktioniert zwar präzise, ist aber relativ langsam und gerade bei längerem Text deshalb
beinahe unbrauchbar. Die zurück- und vor- Funktionen sind auf die vorderen (mit dem
Zeigefinger bedienbaren) Tasten gelegt, wobei die linke Taste die zurück- Funktion und
analog die rechte Taste die vor- Funktion ausführt. Weitere Funktionen wie zoomen,
das Wechseln einer Seite, Aufrufen des Browsermenüs etc. werden auf die restlichen
Tasten aufgeteilt.
Nintendo Wii
Die Wii-Konsole von Nintendo bietet einen auf Opera basierenden Browser, welcher
dem Konzept gemäss mit der Wiimote gesteuert wird (vgl. mein Test des Wii-Browsers,
Web11). Die Texteingabe funktioniert über ein On-Screen-Keyboard, auf welchem mittels Point& Click einzelne Ziffern nacheinander eingegeben werden können, indem man
mit einem von der Wiimote gesteuerten Cursor auf den entsprechenden Buchstaben
zeigt und diesen sodann durch einen Druck auf die grosse “A“-Taste der Wiimote in
ein Textfeld übernimmt. Dieses System funktioniert intuitiv (wie meist auch die restliche Bedienung der Wii), da die Cursorbewegung aber nicht sehr präzise ist und die
Ziffern-Buttons relativ klein sind muss mit häufigem Vertippen gerechnet werden. Dadurch kann Text nicht fliessend eingegeben werden, zudem ermüdet die Hand relativ
schnell, wenn die Wiimote mit ihrem nicht ganz unerheblichen Gewicht über längere Zeit
sehr präzise gehandhabt werden muss. Die Navigation im Browser erfolgt ähnlich, zum
Öffnen eines Links wird auf diesen gezeigt und dann wiederum mittels der “A“-Taste ein
Klick ausgelöst. Die vor- und zurück- Funktionen können am einfachsten in einem Menü
aufgerufen werden, welches erscheint, sobald man den Cursor an den unteren Bildschirmrand bewegt. Um den Content zu scrollen wird auf eine einfache Gestik zurückgegriffen: mittels der Zeigefinger-Taste erscheint ein Kreis um den Cursor, von welchem
aus sodann eine Linie in die zu scrollende Richtung gezogen und zugleich auch in die
entsprechende Richtung gescrollt wird. Die Zoomfunktion ist auf die Plus- respektive
Minus- Tasten der Wiimote gelegt, wobei automatisch markierte Passagen der Webseite
(welche aufgrund der HTML-Struktur vom Browser selbständig identifiziert werden) beim
Zoomen ins Zentrum gerückt werden.
2.3 Interfaces & Textinput
Kombination von Tastatur mit Touchpad, Trackball, oder Akzelerometer
Tastaturen an sich ermöglichen nebst Textinput prinzipiell eigentlich auch eine Navigation auf Webseiten. So kann beispielsweise mittels der Tabulator-Taste von Link zu Link
gesprungen und dieser sodann mittels der Enter-Taste aktiviert werden, oder die Pfeiltasten (im NumLock-Modus auch der Zahlenblock) dienen zur Steuerung des Cursors.
Da dies aber nicht wirklich praktikabel ist und zudem auch nicht auf jeder Webseite
funktioniert werden, für dieses Projekt reine Tastaturen nicht in Betracht gezogen.
Auf dem Markt sind aber auch zahlreiche Produkte erhältlich, welche eine Tastatur mit
einem weiteren Maus-emulierenden Interface kombinieren. Im Zusammenhang mit dieser Arbeit am ehesten interessant erscheinen vor allem diejenigen, welche relativ klein
sind. Auf einige unterschiedliche soll nachfolgend kurz eingegangen werden.
Das Logitech DiNovo Mini-Keyboard (vgl. Web14) kombiniert eine kleine kabellose
QWERTZ-Tastatur mit einem Clickpad (d.h. Pad mit vier Richtungspfeilen), welches
auch als Touchpad benutzt werden kann. Mag die Tastatur noch treffsicher bedienbar
sein, so fällt jedoch das Touchpad relativ klein aus, weshalb es wohl nicht zu einer flüssigen Steuerung eines Cursors benutzt werden kann. Auch eine Navigation mittels der
Richtungstasten im Clickpad-Modus ist wohl eher zu bedienen von Menüs geeignet als
zur Navigation eines Cursors . Das DiNovoMini kann mit beiden Händen gehalten und
der Text mit den Daumen eingegeben werden.
Ein weiteres Produkt (Hersteller unbekannt, vgl. Web15) bietet ebenfalls eine kabellose,
kleine, vollständige Tastatur, jedoch in Kombination mit einem reinen, etwas grösseren
Touchpad. Dieses ist jedoch oberhalb der Tasten angeordnet, was eine angenehme Bedienung erschwert. Zudem erscheint mir auch die Grösse dieses Touchpads noch als zu
klein, um damit angenehm arbeiten zu können. Auch bei diesem Produkt kann Text mit
den Daumen eingegeben werden.
Eine Variante mit Trackball wird von Trust angeboten (vgl. Web16), welche jedoch etwas grösser ausfällt, so dass das Keyboard zur Texteingabe aufliegen muss. Links und
rechts der Tastatur befinden sich leicht erhöht die weiteren Eingabeelemente, welche
mit den Daumen bedient werden können, wenn das Keyboard in den Händen gehalten
wird. Auf der linken Seite sind ein Scrollrad (nur vertikales Scrollen möglich) sowie einige Medien-Tasten (Play/Pause, Lautstärke etc.) integriert, auf der rechten Seite befindet sich ein Trackball. Die Maustasten befinden sich an der Front, auf der linken Seite
die linke Maustaste (Primärklick), analog auf der rechten Seite die rechte Maustaste
(Sekundärklick), welche mit den Zeigefingern bedient werden. Dieses Keyboard habe
ich auf seine Funktionalität hin getestet, siehe hierzu Punkt 4.2.
Eine Tastatur- Akzelerometer – Kombination bietet das MSI Air-Keyboard (vgl. Web17),
welches nebst einer vollständigen Tastatur auch Medientasten enthält. Der Cursor wird
über die Bewegung des gesamten Keyboards gesteuert, die Messung der Bewegung
geschieht aber nur im relativen Modus (kein Pointing wie bei einer Wiimote) über einen
Akzelerometer, was wohl eine schnelle, genaue Positionierung des Cursors verunmöglicht.
2.0 Hintergrund-Recherche
2.3 Interfaces & Textinput
Textra
Die Firma Textra (vgl. Web13) hat mit dem AZtext-Keypad und dem AZ-Pen eine gestenbasierte Variante zur Texteingabe erstellt, bei welcher aber nicht einfach Buchstaben
“nachgemalt“ werden, sondern auf der das Alphabet aufgrund seiner Anordnung mit
jeweils einer links, rechts, oben , unten oder links-oben, rechts-oben etc. Geste eingegeben werden kann. Was textuell erklärt ein wenig kompliziert tönt, kann auf der Webseite
mit interaktiven Demos besser verstanden werden. Die gefundene Lösung erscheint
schlicht, ist aber wohl eher für Handy-Tastaturen geeignet und benötigt wahrscheinlich
einiges an Training, damit Text flüssig eingegeben werden kann.
Keybong (Sonic Texting)
Beim Sonic Texting (vgl. Rinott:1ff ) wird mittels des Keybongs (ein 8-Achsen-Joystick,
welches ähnlich wie das Wii-Nunchuck mit einem Daumen bedient wird), Text über die
Richtung des Joysticks eingegeben. Die momentan angewählte Ziffer wird dabei vom
System vorgelesen und solange wiederholt, bis sich die Position ändert oder die Ziffer
eingegeben wird. Die Ziffern sind auf 8 Achsen angeordnet, welche eine erste Auswahl
generieren, bevor sich jede Achse in 5 weitere Unterachsen aufsplittet, auf welchen
wiederum durch Ausrichtung des Joysticks in die entsprechende Richtung ein einzelner Buchstabe angewählt werden kann. Obwohl ich dieses Prinzip als sehr interessant
empfinde, ist es wohl so kompliziert, dass es sich nur schwer und auch sehr langsam
benutzen lässt.
GlideTV
GlideTV (vgl. Web18) wird von den Produzenten als “The worlds 1st couch mouse“
angepriesen. Es handelt sich hierbei um ein kleines Touchpad mit einigen Medientasten,
welches in die Handfläche passt. Der Mauscursor wird mit dem Daumen gesteuert,
ein Klick wird anscheinend mittels eines Tap’s ausgelöst. Texteingabe wird durch ein
On-Screen-Keyboard realisiert, indem der Mauscursor auf eine Ziffer nach der anderen
bewegt und geklickt werden muss. Obwohl dieses Touchpad angenehm in der Hand
zu liegen scheint, bezweifle ich, dass der Cursor mit dem Daumen auf einer so kleinen
Fläche präzise bewegt werden kann.
Rollermaus
Als weiteres, interessantes Interface soll auch noch kurz die sogenannte Rollermaus
angesprochen werden, ein Mausersatz, welcher direkt unterhalb einer Tastatur plaziert
werden kann. Die Navigation erfolgt über einen Rollstab, der Bewegungen auf dem
Bildschirm in alle Richtungen zulässt. Der Rollstab bietet bequem allen Fingern beider
Hände Platz. Geklickt werden muss mit den Daumen. Für eine Verwendung auf dem
Sofa scheint mir dieses Prinzip nicht geeignet, da bei einer Benutzung auf dem Schoss
die Handgelenke stark angewinkelt werden müssen.
Abbildungen zu 2.2 & 2.3
DiNovo Mini
Trust
Hersteller unbekannt
MSI Air
KeyBong
GlideTV
3.0 Kontext-Recherche
3.1 Nutzer-Befragung & Analyse
In der Nutzer-Befragung wurden 3 Testpersonen beobachtet und befragt, welche auf
die eine oder andere Art bereits Internet auf dem TV benutzen. Hierbei von Interesse
war für mich vor allem, was die Vorteile und Nachteile ihrer momentan benutzten Setups
sind, und wofür sie das Internet auf dem TV nutzen respektive nutzen würden, wenn ihre
Setups oder mein geplanter Prototyp besser bedienbar wäre.
Für alle Grafiken siehe Anhang 1.
User & Setup 1
Das Setup der ersten Testperson ist wohl das technisch gesehen Einfachste: es besteht
aus einem fix montierten Beamer, welcher auch zum Fernsehen benutzt wird, einem
normalen Laptop und einer an den Laptop angeschlossenen Wireless-Maus. Die Laptop-Maus-Kombination funktioniert in sich und wird lediglich per Kabel an den Beamer
angeschlossen. Zur Texteingabe wird die Tastatur des Laptops verwendet. Beim Surfen
kommt ein für Computer gängiger Browser zum Einsatz.
Dieses Setup wird vor allem verwendet, wenn mehrere Personen anwesend sind, um
sich gegenseitig interessante Webseiten, YouTube-Videos etc. zu zeigen, was auf dem
Laptop-Bildschirm mühsam ist. Zudem können zusammen Filme angeschaut werden,
welche direkt aus dem Internet gestreamt werden. Auch in der Gruppe genutzt wird das
gemeinsame Musikhören im Internet. Des Weiteren kann das Internet auf dem Beamer
auch als Informationsquelle für z.B. aktuelle Partynews dienen, die Auswahl kann von
allen anwesenden Personen betrachtet und diskutiert werden.
Vorteile:
- Beliebiger Computer anschliessbar
- Gewohnter Browser
- Alle Bookmarks vorhanden
Nachteile:
- Keine fixe Installation, somit kein spontaner Zugriff
- Texteingabe sehr mühsam
- Maus funktioniert nur bedingt auf Sofa
- Keine Zoom-Funktion
- Lesbarkeit abhängig von Auflösung
User & Setup 2
Das Setup der zweiten Testperson besteht aus einem grossformatigem TV-Gerät, einem
daran angeschlossenen Mac Mini und einer an den Mac angeschlossenen kabellosen
Maus-Keyboard-Kombination. Der Mac Mini ist fix plaziert und dient effektiv nur der
Nutzung des Internets sowie weiterer Medieninhalte am TV. Zum Surfen wird ein für
Computer gängiger Browser verwendet. Ein grosser Vorteil dieser Installation besteht
darin, dass der Mac Mini immer an den TV angeschlossen ist und somit relativ rasch und
auch spontan auf das Internet zugegriffen werden kann. Der MacMini wird meist für den
Zugriff auf eine Mediathek, aber auch zum Surfen im Internet verwendet.
Die Steuerung mittels einer normalen Tastatur und Maus, welche meist auf einem Tisch
vor dem Sofa plaziert sind, ist relativ unergonomisch.
Vorteile:
- Fixe Installation
- Relativ schneller Zugriff
- Auch andere Funktionen verwendbar
- Gewohnter Browser
- Alle Bookmarks vorhanden
Nachteile:
- Texteingabe unergonomisch
- Maus funktioniert nur bedingt auf Sofa
- Nur normale Apple-Zoom-Funktion
- Kein spezialisierter Browser
- Lesbarkeit abhängig von Zoom
User & Setup 3
Das Setup der dritten Testperson besteht aus einem grossformatigen TV-Gerät und
einer daran angeschlossenen Playstation 3. Die Playstation wird mittels eines originalen
PS-Controllers bedient, es kommen keine weiteren HID’s zum Einsatz. Zum Surfen wird
ein eigener, in das PS-3-Betriebssystem integrierter Browser verwendet.
Auf diesem System wird das Internet für die unterschiedlichsten Zwecke benutzt, sei es
für Internet-Recherchen, zur Unterhaltung oder auch einer eher TV-bezogenen Nutzung
zum Streamen von Filmen aus dem Web. Der Vorteil dieses Systems liegt darin, dass
es sofort Betriebsbereit ist und somit auch eine klare Alternative zu normalen Computern darstellt, wenn es darum geht, schnell mal was im Internet nachzuschauen, ohne
dafür extra den Computer aufstarten zu müssen. Des Weiteren besitzt dieses Setup
als einziges einen Controller, welcher auf dem Sofa bequem benutzt werden kann. Ein
Nachteil ist aber die etwas umständliche Texteingabe.
Vorteile:
- Fixe Installation
- Sofort und spontan einsetzbar
- Sofa- fähiger Controller
- Angepasster Browser
- Angepasste Zoomfunktion
Nachteile:
- Texteingabe nicht optimal
- Cursor langsamer als Maus
- Kein Standardbrowser
- Nicht die gewohnten Bookmarks
3.0 Kontext-Recherche
3.1 Nutzer-Befragung & Analyse
Usability-Diagramme : Schlussfolgerungen
Funktionalität vs. Komfort
Werden computerbasierte Interfaces wie Maus und Tastatur im Sofa-Kontext benutzt, ist
der Komfort umso kleiner, je grösser die eigentliche Funktionalität der Interfaces ist. Bei
spezialisierten Interfaces wie z.B. dem PS3-Controller verhält es sich genau umgekehrt.
Es muss also nach Lösungen gesucht werden, welche sowohl einen hohen Komfort als
auch eine Mindestfunktionalität bei beispielsweise der Benutzung auf einem Sofa bieten.
Zooming gewährleistet Lesbarkeit
Das Zooming und die Lesbarkeit stehen wohl in unmittelbarem Zusammenhang, da aufgrund des Abstands zum Screen und der Auslegung der meisten Webseiten auf einen
Desktop-Kontext die Lesbarkeit im Wohnzimmer- Kontext nicht immer gewährleistet
sein wird. Sie kann jedoch mittels gut steuerbaren Zoom-Funktionen im Bedarfsfall sicher einfach optimiert werden.
Bookmark-Zugriff optimiert Komfort
Der Bookmark-Zugriff scheint von grosser Wichtigkeit zu sein, da die Texteingabe-Funktionalität bei einem Web-Zugriff mittels eines TV’s wahrscheinlich nie so optimal wie bei
einem Desktop-Setup sein wird. Ist jedoch ein guter Bookmark-Zugriff gewährleistet,
kann wahrscheinlich auf einen Teil der Texteingaben verzichtet werden, oder es reichen
Textfragmente, um gewünschte Webseiten aufrufen zu können.
Nutzungszweck-Diagramme: Schlussfolgerungen
Arbeit im Wohnzimmer scheint unerwünscht zu sein, das Lesen von Mails gehört aber
zum Alltag, wieso es also nicht auf dem Sofa erledigen.Auch Web-Recherchen sowie
Online-Shopping können laut der Meinung der Testpersonen gut in einen angenehmeren
Kontext verlagert werden.Online-Kommunikation mittels Skype oder Chat könnte ebenfalls gut auf dem Sofa stattfinden, hierbei kommt es wohl darauf an, wie öffentlich die
Situation und wie privat das Gespräch ist. Dasselbe gilt für die Nutzung von Social-Apps
wie z.B. Facebook.
Surfen zum Spass macht in einer angenehmeren Umgebung eventuell noch mehr Spass.
Der soziale Aspekt scheint eine grosse Rolle zu spielen, Nutzungsarten wie das gemeinsame Ansehen respektive Zeigen von Web-Videos oder generell Webseiten scheinen
im Wohnzimmer auf angenehmere Weise praktizierbar zu sein als in arbeitsbezogenen
Umgebungen.
Die Nutzung von audiovisuellen Medien scheint automatisch mit einem WohnzimmerKontext assoziiert zu werden und kann somit auch mit dem Web als Quelle dort stattfinden, laut Umfrageergebnissen sogar präferiert, wahrscheinlich auch mit dem Hintergrund der gemeinsamen Nutzung.
Der Konsum von z.B. gestreamten Filmen entspricht der klassischen Nutzung des TV’s
und ist dementsprechend auch in einem Wohnzimmer-Web-Kontext beliebt.
3.1 Usability- & Nutzungszweck-Diagramme
Nutzungszweck
Organisation
Private Nutzung
Skype / Chat
Word etc.
Facebook
Mail
YouTube
Recherche
Spassbrowsen
Online Games
Online einkaufen
News
Links zeigen
Blogs
Filme streamen
Videos zeigen
Partykalender
Musik hören
2
Öffentliche Nutz.
Musik-Videos
3
4
Arbeit
Info
5
6
Sozial
Spass
3.0 Kontext-Recherche
3.2 Moodboard
Das von mir erstellte Moodboard (Anhang 2) sollte einerseits alle Bereiche aufzeigen,
welche Zusammenspielen müssen oder zumindest sollten, wenn Internet und TV kombiniert werden. Andererseits habe ich es auch gleich dazu benutzt, Vor- und Nachteile
der einzelnen Bereiche zu identifizieren, welche für das Web auf dem TV übernommen,
adaptiert oder vermieden werden sollten.
Home Office
Vorteile: Ergonomie, schnelle Texteingabe, gute Lesbarkeit von Webinhalten
Nachteile: Büro-Atmosphäre, meist Einzelarbeitsplatz, kein sozialer Raum
Living Room
Vorteile: relaxte Atmosphäre, bequemes Ambiente, sozialer Raum
Nachteile: meist nur TV-Content, kein Webzugriff oder schlechte Bedienbarkeit
Das Web an sich
Vorteile: Bedienbarkeit, ungehinderter Web-Zugriff, Bookmarks
Nachteile: für die Maus und Computer optimiert, Arbeits-Atmosphäre
Couch-Laptop
Vorteile: bequemes Ambiente, Standard-Browser, Bookmarks
Nachteile: Bedienbarkeit, unergonomisch, Behelfs-Lösung
Living Room Web
Vorteile: gemeinsames Erlebnis, relaxte Atmosphäre, direkter Austausch
Nachteile: kleines Display, schlechte Sicht, unergonomisch
Social TV
Vorteile: gemeinsames Erlebnis, bequemes Ambiente, direkter Austausch
Nachteile: nur TV-Inhalte, kein Web-Zugriff, Bedienbarkeit eingeschränkt
3.3 Funktionsumfang des Browsers
Um feststellen zu können, welche Funktionalität gängige Browser im Originalzustand
bieten, also direkt nach der Installation und ohne den Funktionsumfang erweiternde Plugins, habe ich Firefox, Safari und den InternetExplorer daraufhin untersucht. Gleichzeitig habe ich auch festgehalten, wie diese einzelnen Funktionalitäten mit unterschiedlichen Interfaces bedient werden.
Des weiteren wurde auch die Funktionen, welche zur Bedienung von TV-Inhalten notwendig sind definiert, da auch TV-Inhalte in den Prototypen integriert werden sollten.
Siehe hierzu Tabelle
Das Resultat aus diesen Untersuchungen ist erstens eine Liste der Mindestfunktionalität,
welche eine Browser erfüllen muss, und zweitens die Erkenntnis, das mittels Gesten
wohl viel effektiver mit dem Browser interagiert werden kann als dies über das klassische
Browser-GUI möglich ist.
Tabelle zu 3.3
3.0 Kontext-Recherche
3.4 Gestik als Inputmethode
Der Nutzen von Gesten
Infolge der Schlussfolgerungen aus dem vorhergehenden Abschnitt habe ich mich
entschlossen, die Steuerung meines Projektes so weit wie möglich über Gesten [4] zu
realisieren, da sie einige Vorteile bieten:
-Gestik erleichtert und unterstützt die Interaktion
-Gestik funktioniert intuitiv und schnell
-Simple Gesten sind einfach erlernbar
-Gesten können an jedem beliebigen Ort auf dem Screen ausgeführt werden
-Maus- respektive Cursor-Bewegungen können minimiert werden
-Buttons an sich und somit auch das Klicken auf Buttons entfallen
Vor allem die drei letzten Punkte sind wesentliche Argumente, um bei meinem Projekt
Gesten zur Interaktion einzusetzen. Gesten können dort gezeichnet werden, wo sich
der Cursor gerade befindet, was die Navigation beschleunigt und somit die Bedienung
erleichtert. Des weiteren kann auf Buttons verzichtet werden, was wiederum den Weg,
welcher bis zu einem Button zurückzulegen ist, einspart, und zudem auch optisch mehr
Fläche für den eigentlichen Inhalt übrig lässt und ein GUI im Browser selbst zu grossen
Teilen überflüssig macht.
Verwendbare Gesten
In meinem Projekt sollen v.a. deiktische und ikonische Gesten (siehe auch [4]) zum Einsatz kommen, da sie meist intuitiv benutzbar oder zumindest einfach erlern-, merk- und
verknüpfbar sind. Eine Übersicht gängiger deiktischer und ikonischer Gesten, welche im
Projekt verwendet werden können, habe ich in der Abbildung nebenan zusammengetragen. Hierbei wurde darauf geachtet, dass die Gesten von gängigen Gesten-ErkennungsAlgorithmen problemlos erkannt werden können. Zudem ist jede Geste in all ihren möglichen Ausführungen (d.h. auf welche Arten sie gezeichnet werden können) aufgeführt.
Ausführungsarten von Gesten
In wantee werden zwei unterschiedliche Eingabemethoden für die Gesten verwendet.
Auf der einen Seite kommen gezeichnete Gesten zum Einsatz, also Gesten, welche
auch optisch auf dem Display dargestellt werden. Um sie von normalen Navigationsbewegungen unterscheiden zu können, wird ein sogenannter “Trigger“ verwendet,
welcher meist durch die rechte Maustaste, im Falle von wantee aber durch längeres,
(0.5 bis 1 sek.) leichtes Drücken des Pen’s auf das Tablet ausgelöst wird.
Auf der anderen Seite kommen sogenannte Flicks zum Einsatz. Flicks sind einfache,
gerade Gesten ohne Kurven oder Ecken, welche durch eine sehr schnelle, leichte Bewegung des Pens aufgerufen werden. Sie haben keine optische Repräsentation auf
dem Display und können die genau gleiche Form und /oder Richtung wie identische
gezeichnete Gesten haben. Siehe hierzu auch Punkte die 4.4 & 4.5.
Mögliche Gesten
3.0 Kontext-Recherche
3.5 Anforderungs-Katalog für das Interface
Nachfolgend habe ich anhand einiger von Ken Hinckley (vgl. Hinckley:161ff) zu InputTechnologie und Input-Techniken aufgestellter Kriterien versucht, einen AnforderungsKatalog für das zu benutzende Interface zu erstellen. Dieser wurder im Verlauf des Projekts immer wieder angepasst und auch mit den Ergebnissen aus den Experimenten
und Tests komplettiert.
Property sensed /Number of Dimension
“Property sensed“ beschreibt, welche Bewegung gemessen wird. Dies kann eine lineare
Position, Bewegung oder auch eine Krafteinwirkung sein. Die “Number of dimensions“
beschreibt die Anzahl benötigter Dimensionen. Eine Maus misst beispielsweise Bewegungen in 2 linearen Dimensionen (vgl. Hinckley: 162).
Um eine Webseite bedienen zu können reicht eine lineare Bewegungsverfolgung auf 2
Achsen, also einer x- und y-Achse wie bei einer normalen Maus üblich, da es sich bei
Webseiten- Content bis anhin immer um 2-dimensionale Inhalte handelt, oder falls eine
(simulierte) dritte Dimension vorhanden ist diese dennoch mittels 2-Achsen-Navigation
bedient werden kann. Eventuell könnte bei einer Bedienung mit einem Pen auch die
Andruckstärke verwendet werden, um gewisse Parameter zu beeinflussen.
Indirect vs. Direct (vgl. Hinckley: 161ff)
Mit einem indirekten Input ist beispielsweise eine Maus gemeint, da der Nutzer sie bewegen muss, um damit einen Cursor auf einem Bildschirm bewegen zu können. Bei direktem Input besteht dieser Umweg nicht, eine Eingabe kann direkt auf einem Touchscreen
vorgenommen werden (vgl. Hinckley: 162).
Da der Hauptbildschirm bei diesem Projekt ein TV ist, welcher einige Meter vom Benutzer entfernt steht, sollte meiner Meinung nach unbedingt einer indirekten Bedienung der Vorzug gegeben werden, da der Nutzer hierbei nie den Blick vom Bildschirm
abwenden muss. Dies vor allem aus zwei wichtigen Gründen: erstens soll ein ständiges
Repositionieren/ Anwinkeln des Kopfes vermieden werden, und zweitens soll auch ein
damit einhergehendes, permanentes Neu-Fokussieren minimiert werden. In einer entspannten, zurückgelehnten Position und zudem einige Meter von einem Monitor entfernt, wie dies bei einem Sofa-TV-Setup der Fall ist, kann es sein, dass der Nutzer
seinen Kopf wesentlich stärker neigen muss um vom TV z.B. auf ein Interface in seinem
Schoss schauen zu können, als dies bei einem Schreibtisch-Setup der Fall ist, wenn
der Nutzer aufrecht sitzt und sein Blick zwischen Tastatur und Bildschirm hin und her
wandert. Durch die grosse Distanz zwischen TV und einem nahe beim Nutzer plazierten
Interface muss bei einem direkten Input zudem stark zwischen nah und fern fokussiert
werden, was auf die Dauer ermüdend wirkt.
Device acquisition time / Homing time
Die “device acquisition time“ beschreibt die nötige Zeit, um die Hand von einer gegebenen Ausgangsposition auf einem Interface zu plazieren, also z.B. von der Tastatur auf
die Maus. Die “homing time“ beschreibt die Zeit, welche benötigt wird, um die Hand
wieder in die Ausgangsposition zu bringen, als z.B. von der Maus auf die Tastatur (vgl.
Hinckley: 162). Idealerweise ist diese Zeit möglichst kurz, was dann erreicht wird, wenn
nicht zwischen verschiedenen Interfaces gewechselt werden muss.
Relative vs. Absolute Mode
Im relativen Modus wird der Cursor unabhängig von der Interfaceposition verschoben,
d.h. wenn z.B. die Maus angehoben wird, bleibt der Cursor an seiner momentanen
Position stehen. Wird nun die Maus zurückversetzt und weiterbewegt, wird der Cursor nicht zurückversetzt aber trotzdem entsprechend der neuen Bewegung der Maus
weiterbewegt. Im absoluten Modus besteht ein fixes C : D -“Gain“ -Verhältnis, die Position des Interfaces korreliert immer direkt mit der Position des Cursors (vgl. Hinckley:
163). Mäuse und Touchpads arbeiten meist im relativen Modus, während Touchscreens
gezwungenermassen im absoluten Modus funktionieren, bei Tablets kann der Modus
oftmals umgestellt werden.
Für mein Projekt erscheint mir ein Interface mit absoluter Positionierung als geeigneter,
da hierbei das Interface den Aktionsradius vorgibt und dieser somit nicht beliebig erweitert werden kann wie dies bei einer Maus möglich ist. Zudem entfällt auch das häufige
Repositionieren, welches bei einer Maus oder vor allem auch bei einem Touchpad häufig
benutzt werden muss, um den Cursor gerade bei einer hohen Auflösung zu positionieren.
Gain
“Gain“ beschreibt das Verhältnis von “control-to-display“ (C : D), also derjenigen Distanz, welche mit dem Interface zurückgelegt wird im Vergleich zur Distanz, welche mit
dem Cursor auf dem Display zurückgelegt wird (vgl. Hinckley: 162).
Dieses Verhältnis sollte im Bezug auf ein Interface, welches auch vom Sofa aus bedient werden kann so gewählt werden, dass sowohl die Platzverhältnisse respektive die
Grösse des Interfaces, aber auch die Auflösung des TV’s berücksichtigt werden. Das
Interface darf also einerseits nicht zu gross sein, denn obwohl die Platzverhältnisse
beschränkt sind, soll eine angenehme Bedienung gewährleistet sein. Andererseits darf
es aber auch nicht zu klein sein, da ansonsten bei einer Auflösung des TV’s von 1920
x1080 (Full-HD) die Navigation ungenau wird oder das Interface sehr präzise bedient
werden muss, was in einer entspannten Haltung eventuell nicht möglich ist.
4.0 Tests & Experimente
4.1 On-Screen-Keyboard
Da in meinem Projekt eventuell ein On-Screen-Keyboard zum Einsatz kommen sollte,
habe ich als erstes einige Tests hierzu durchgeführt, um ein Gefühl dafür zu bekommen, wie gut dieses ohne Maus zu bedienen ist. Das On-Screen-Keyboard lief im
Browser, da dies bei einem Einsatz im definitiven Prototypen auch so sein sollte. Als
Eingabemedium zum Einsatz gekommen ist erstens ein Wacom-Tablet, wobei die
Eingabe mittels des Pens vorgenommen wurde. Als zweites Input-Device wurde das
Trackpad eines Macbook Pro’s verwendet.
Die Texteingabe funktioniert so, dass der Mauscursor mittels Pen oder Finger auf der
gewünschten Ziffer positioniert und sodann darauf geklickt wird. Mit beiden Interfaces
wurde jeweils derselbe Text eingegeben und dieselben Löschaktionen ausgeführt. Es
hat sich gezeigt, dass die Eingabe mit beiden Interfaces in etwa gleich schnell und im
Allgemeinen auch relativ flüssig vonstatten ging. Ein Vorteil des Pen’s ist seine grössere
Präzision, ein Vorteil des Trackpas besteht darin, dass ausser einem Finger zur Texteingabe nichts weiter benötigt wird.
Zwar kann Text auf diese Weise niemals so schnell wie mit einer Tastatur eingegeben
werden, dennoch funktioniert diese Methode schneller und besser als die Eingabemethoden z.B. der Playstation 3 und der Wiii (siehe hierzu 2.2). In einem weiteren
Prototypen habe ich später versucht, die Texteingabe mittels Finger noch zu verfeinern,
siehe hierzu auch Punkt 4.4.
Ein Video zu diesem Test ist auf dem Projekt-Blog verfügbar (vgl. Web24).
4.2 Keyboard-Trackball-Kombination
Stellvertretend für die diversen in der Hintergrundrecherche aufgeführten Kombinationen aus einer Tastatur und einem Mausersatz habe ich ein “Trust Wireless Entertainement Keyboard“ (vgl. Punkt 2.3) erworben und getestet. Das Keyboard ist in
etwa so gross wie eine kleinere “normale“ Tastatur und hat nebst einer vollständigen,
teilweise miniaturisierten Tastatur mit angepasstem Layout auch einige zusätzliche
Medien-Tasten, von welchen zur Steuerung des Internets aber nur die “Home“-Taste
verwendet werden kann. Aufgrund ihrer Grösse muss die Tastatur beim Tippen irgendwo (z.B. auf den Oberschenkeln) aufliegen. Dadurch müssen die Handgelenke relativ
stark angewinkelt werden, was ich als unangenehm und unergonomisch empfunden
habe und mich zudem beim Tippen etwas behindert hat.
Das Tastaturlayout wurde etwas “gequetscht“ und angepasst, so ist beispielsweise
die Leertaste nur ca. 6cm lang, am rechten Rand wurde eine Reihe Sondertasten wie
“PageUp“ oder “End“ angesetzt und unterhalb der “Return“-Taste wurden die Pfeiltasten integriert. Dies macht es auch bei Beherrschung des 10-Finger-Systems etwas
schwierig, fliessend auf der Tastatur zu schreiben ohne darauf zu sehen.
Links und rechts der Tastatur befinden sich leicht erhöht die zusätzlichen Eingabeelemente, welche mit den Daumen bedient werden können, wenn das Keyboard in den
Händen gehalten wird. Auf der linken Seite sind ein Scrollrad (nur vertikales scrollen
möglich) sowie einigen Medien-Tasten (Play/Pause, Lautstärke etc.) integriert, auf der
rechten Seite befindet sich ein Trackball. Dieser kann eigentlich nur mit dem rechten
Zeigefinger oder besser Daumen bedient werden, was das Keyboard für Linkshänder
praktisch unbedienbar macht. Um den Cursor präzise steuern zu können muss die
Zeigergeschwindigkeit relativ langsam sein, was häufiges Nachgreifen zur Folge hat.
Eine Eingabe von Gesten ist nur schwer zu bewerkstelligen.
Die Maustasten befinden sich an der Front, auf der linken Seite die linke Maustaste
(Primärklick), analog auf der rechten Seite die rechte Maustaste (Sekundärklick),
welche mit den Zeigefingern bedient werden. Dies erwies sich als recht ungewohnt, da
die Maustasten-Funktionen nun auf einmal auf zwei Hände aufgeteilt sind. Das Spezielle daran ist, dass ich mich als Rechtshänder gewohnt bin, mit dem Zeigefinger der
rechten Hand zu klicken, wenn ich einen Link öffnen will. Durch diese Verteilung der
Maustasten auf zwei Hände musste ich nun aber auf einmal mit dem linken Zeigefinger
klicken, um dasselbe zu erreichen. Um die Maustasten angenehm bedienen zu können
muss das Keyboard zudem optimalerweise angehoben werden, was etwas umständlich ist, da es zum Schreiben wie bereits erwähnt aufliegen muss.
Bei Betrachtung aller vorhergehend aufgeführten Negativpunkte sowie der unter Punkt
3.5 erstellten Anforderungen hat sich diese Art von Interface als suboptimal erwiesen,
der einzige grosse Vorteil liegt in der relativ schnell vonstatten gehenden Texteingabe.
Auch andere, in der Hintergrund-Recherche erwähnte kleinere Keyboard-Kombinationen weisen wohl ähnliche Mängel auf. Zwar muss bei diesen das Keyboard nicht
unbedingt aufliegen, jedoch kann dann nicht mit 10 Fingern getippt werden, was wiederum die Texteingabe verlangsamt. Des weiteren dürfte bei diesen anderen Interfaces
die Maus-Emulation (meist schon Aufgrund der Grösse) ähnlich unpräzise sein.
4.3 Adobe-Air basierter Browser
Da ein Browser zu den Kernelementen meines Projektes gehört, habe ich mich frühzeitig nach Möglichkeiten umgesehen, einen fast beliebig anpassbaren Browser zu
realisieren. Das Problem hierbei war, dass dieser auch mit einem anderen Interface als
einer Maus kontrolliert werden können sollte, zudem sollte auch eine eventuelle Oberfläche den Gegebenheiten eine TV-Screens angepasst werden können, weshalb meine
Wahl schliesslich auf Adobe Air und ActionScript als Entwicklungsumgebung fiel.
Der Kern des Browsers wurde mit dem HTMLloader der Air 2 Beta SDK implementiert, welcher auf der WebKit-Engine basiert. Dank einiger noch undokumentierter
neuer Features und mit viel tüfteln und ausprobieren verbrachter Zeit gelang es mir,
den Browser mit den von mir benötigten Funktionen zum Laufen zu bringen. Dieser
als Testprototyp erstellte Basis-Code hat schlussendlich auch Eingang in den wanteePrototyp gefunden.
4.0 Tests & Experimente
4.4 Touchpad
Für erste Experimente wurde ein “Wacom Bamboo Touch“-Touchpad (vgl. Web20)
verwendet, welches das einzige zurzeit auf dem Markt erhältliche Touchpad zu sein
scheint, das grösser als ein Standard Laptop-Touchpad ist. Der Treiber des Bamboo
Touch emuliert erstens eine Maus im relativen Modus und kann zweitens mehrere
nachfolgend aufgelistete simple Gesten erkennen, welche jedoch nicht verändert
werden können. Mehr als 2 Finger können vom Bamboo Touch nicht erkannt werden,
und eine Benutzung im absoluten Modus ist nicht vorgesehen.
-Ein-Finger Bewegung (emuliert Mauscursor)
-Ein-Finger-Tip (emuliert Klick)
-Ein-Finger Doppel-Tip ( emuliert Doppelklick)
-Zwei-Finger-Tip ( emuliert rechte Maustaste für Kontextmenü)
-Zwei-Finger Scrollen vertikal
-Zwei-Finger Scrollen horizontal
-Zwei-Finger-Flick nach links (emuliert Zurück-Funktion)
-Zwei-Finger-Flick nach rechts (emuliert Vorwärts-Funktion)
-Zwei-Finger-Pinch von innen nach aussen (emuliert Einzoomen)
-Zwei-Finger Pinch von aussen nach innen (emuliert Auszoomen)
-Zwei-Finger Rotation
Diese vorhandenen Gesten reichen zur Steuerung meiner Anwendung aber nicht aus,
(siehe hierzu auch Punkt 3.3), zudem können auch durch das Bewegen von zwei Finger gleichzeitig keine weiteren Gesten erkannt und gezeichnet werden, da der Treiber
die Mausfunktionalität blockiert, sobald zwei Finger auf dem Pad aufliegen.
Ich habe deshalb nach einer Möglichkeit gesucht, die X- und Y-Positionen der einzelnen Finger direkt abzugreifen, ohne dass eine Maus emuliert und so der Cursor bewegt wird. Dies ist mir dank eines Bamboo-to-TUIO-Treibers (vgl. Web21) gelungen
[1]. Der TUIO-Treiber sendet die X- und Y-Koordinaten der Finger an FLOSC. FLOSC
(FlashOpenSoundControl, vgl. Web 22) ist ein Java-Server, welcher die empfangenen
Daten nach OSC [2] portiert und sie über den TCP-Port zur Verfügung stellt. FLOSC
stellt somit die Verbindung zwischen Flash (in welchem dieser Prototyp programmiert
wurde) her, die von FLOSC bereitgestellten Daten können in Flash mittels eines NetSockets verarbeitet werden.
Die vom Bamboo-TUIO-Treiber gelieferten Werte entsprechen der absoluten Position
der Finger auf dem Touchpad, die Bewegungen können somit 1:1 auf die Applikationsoberfläche übertragen und aufgrund ihrer X- und Y-Position auf Touchevents oder
Gesten hin analysiert werden.
Gestik-Erkennung
Die Gestik-Erkennung geschieht in diesem Prototyp aufgrund der Analyse von Mausoder Fingerbewegung. Für gezeichnete Gesten wird ein Trigger benötigt, welcher die
Gesten-Erkennung startet, damit zwischen normalem Navigieren und der Eingabe
einer Geste unterschieden werden kann. Als Trigger dient in diesem Falle die rechte
Maustaste (welche anstatt eines Kontextmenüs die Gestik-Erkennung aktiviert) oder
ein zweiter Finger (respektive ein zweiter Touchpoint).
Die von mir in den Prototypen verwendete Methode basiert auf der Zerlegbarkeit der
Gesten in einzelne Richtungen, welche eine Zahlenfolge ergeben (vgl. auch Web23 ).
Vordefinierte Geste werden auf ihren Aufbau hin analysiert und in möglichst prägnante,
einzelne Schritte unterteilt, welche nötig sind, um sie zu zeichnen. Diesen einzelnen
Schritten werden danach jeweils eine von 8 charakteristischen Richtungen zugewiesen, wobei jede dieser 8 Richtungen für eine Zahl zwischen 0 und 7 steht. Anhand
diese Richtungs- oder Bewegungsablaufs wird sodann eine Zahlenfolge generiert,
welche für diese Geste steht.
Wird nun die Gesten-Erkennung aktiviert, wird jede nachfolgende Bewegung wiederum einer dieser 8 Richtungen zugeordnet. Welche Richtungen oder respektive welche
daraus resultierende Zahlenkombination am wahrscheinlichsten ist, wird mittels der
Levenshtein-Distanz-Formel [3] berechnet. Die durch die Gesten-Erkennung generierte
Zahlenfolge wird nun mit allen Zahlenfolgen der gespeicherten Gesten verglichen und
im Falle einer Übereinstimmung die der Geste zugeordnete Aktion ausgelöst.
Für die Erkennung von Flicks ist kein eigentlicher Trigger nötig, die Cursorbewegung
muss deshalb ständig mitverfolgt und in diesem Fall auf starke, kurzzeitige Beschleunigung in eine bestimmte Richtung überwacht werden. Aus diesem Grund bestehen
Flicks auch nur aus einfachen, strichförmigen Gesten ohne Kurven oder Ecken (siehe
hierzu auch Punkt 3.4).
Im grossen und ganzen hat diese Technik zur Gesten-Erkennung funktioniert, sie liess
aber an Präzision zu wünschen übrig. Die Erkennung von Flicks hat leider nie wirklich
funktioniert, wobei ich auch nicht eruieren konnte, ob der Fehler in meinem Code oder
allgemein an der Event-Verarbeitung von Flash gelegen hat, oder ob sie schlicht aus
Performance-Gründen nicht zum Laufen zu bringen war, da ein ständiges Überwachen
der Fingerkoordinaten einiges an Rechenleistung erfordert.
4.0 Tests & Experimente
4.4 Touchpad
Schlussendlich hat aber ein anderes, relativ banales Problem dieses Setup zum Scheitern verurteilt: der von mir in Flash erstellte Browser konnte die TUIO-Touchevents nicht
als Klicks interpretieren, das heisst, es konnte nicht mit dem Finger auf ein Link geklickt
werden. Da weder Flash noch Air aus sich heraus native System-Clicks generieren
können, hätten die TUIO-Daten zu Maus-Daten emuliert werden müssen, was dann
aber wiederum bedeutet hätte, dass nur noch ein Koordinatenpaar zur Verfügung steht
und nicht mehr zwei, und somit auch die Gestik-Erkennung nicht mehr funktioniert.
Textinput
Ein Textinput mittels Finger war somit nicht mehr allzu schwer zu realisieren, es musste
lediglich ein On-Screen-Keyboard erstellt werden, welches auf Touchevents reagiert.
Im Gegensatz zum ersten Test mit On-Screen-Keyboards (siehe hierzu Punkt 4.1) sollte
nun aber nicht mehr zuerst der Cursor auf eine Ziffer bewegt und dann geklickt werden
müssen, sondern die entsprechende Ziffer sollte direkt angetippt werden können.
Auch dies war dank absoluter Positionsdaten der Touchevents leicht zu bewerkstelligen. Aufgrund des TUIO Trackings ist aber kein eigentlicher Mauszeiger mehr vorhanden, der Finger erzeugt auf dem Bildschirm nur dann eine optische Repräsentation,
wenn auf das Touchpad gedrückt wird. Um direkt Text eingeben zu können muss also
quasi ins leere getippt werden, was sich als relativ schwierig und auch nicht gerade
benutzerfreundlich erwiesen hat. Testweise habe ich deshalb eine Tastatur auf das
Touchpad “gezeichnet“, worauf die Texteingabe relativ gut funktioniert hat, so konnte
auch mit zwei Fingern abwechselnd getippt werden.
Der Nachteil bestand aber darin, dass nun zum Tippen (zumindest während einer
Eingewöhnungsphase) auf das Touchpad geschaut werden musste, was eigentlich
den unter Punkt 3.5 Anforderungen definierten Anforderungen an das Interface widersprach.
4.5 Pen & Tablet, Handschriften-Erkennung
Nachdem die Tests mit dem Touchpad nicht besonders erfolgreich verlaufen sind, war
der Gedanke naheliegend, anstatt der Finger einen Pen und ein Tablet als Interface zu
testen, da dies technisch gesehen viel näher an einer Maus und deshalb unproblematischer zu handhaben und einzubinden ist. Hierzu wurde ein Wacom Bamboo Pen &
Touch (vgl. Web25) verwendet.
Die Stifteingabe funktionierte problemlos, auch die Rate der erkannten Gesten konnte
dank des präziseren Inputs gesteigert werden, war jedoch immer noch nicht völlig
befriedigend. Deshalb habe ich zu diesem Zeitpunkt auch beschlossen, zur GestikErkennung eine externe Software zu verwenden, welche direkt im System und nicht in
Flash läuft, was vor allem den Prozessor entlastet und generell dank nativem Zugriff auf
die Cursorbewegung besser funktioniert.
Da nun schon ein Stift im Spiel war konnte mit diesem auch der Textinput per
Handschriftenerkennung erfolgen. Weil schon die Gestik-Erkennung in Flash nicht
besonders gut funktioniert hat, bestand keine Aussicht darauf, eine HandschriftenErkennung in Flash implementieren zu können. Deshalb habe ich zwei unterschiedliche
Programme dazu getestet. Einerseits die in Windows 7 integrierte HandschriftenErkennung (in den Tablet-Funktionen zu finden), andererseits MyScript Stylus von
Visionobjects (vgl. Web26), eine Standalone-Software. Die Erkennung der Handschrift
funktionierte in beiden Programmen auf Anhieb überraschend gut, die Textbearbeitungs-Funktionalitäten sind in etwa dieselben. Nach längerem austesten hat sich dann
schlussendlich jedoch Windows 7 als sinnvoller erwiesen, da es insgesamt besser in
den Prototypen integriert werden konnte.
5.0 Das wantee-Konzept
Die Konzept-Idee hinter wantee kann eigentlich in einem Satz zusammengefasst
werden: wantee soll Web & TV vereinen, mittels Gesten steuerbar sein und ein komfortables gemeinsames Erlebnis unterschiedlichster Medieninhalte in angenehmer
Umgebung ermöglichen. Mit diesem Ziel vor Augen und allen vorher erwähnten Recherchen, Test und Experimenten im Hinterkopf habe ich versucht, ein stringentes
Konzept zu entwickeln, auf welches nun nachfolgend eingegangen werden soll.
5.1 Wahl des Interfaces
Nach den diversen Tests (Punkt 4) und auch der Evaluation der Anforderungen an das
Interface (Punkt 3.5) haben sich der Pen und das Tablet als klar beste Variante erwiesen, was auch durch die Vergleichstabelle ersichtlich wird.
Wert / I nterfa ce
Maus
Key- kombi
Touchscreen
Property /D imensions
x, y, 2
x, y, 2
x, y, 2
Indirect / D irect
Touchpad
Pen & Tablet
x, y, 2
x, y, 3
indirekt 1
indirekt 1
indirekt 1
direkt 0
indirekt 1
Aquisition / H oming
mitt el 1
hoch 0
gering 2
mitt el 1
gering 2
Relative / A bsolute
relativ 0
relativ 0
absolut 1
relativ 0
absolut 1
Gain
gross 0
gross 0
mitt el 1
mitt el 1
gering 2
Präzision
gross 1
gering 0
mitt el 1
mitt el 1
gross 2
ja 1
nein 0
ja 1
ja 1
ja 1
mitt el 1
gross 2
mitt el 1
mitt el 1
mitt el 1
gut 2
sch lecht 0
mitt el 1
mitt el 1
gut 2
7
3
8
7
Linkshänder-tauglich
Text -Input-Speed
Gest ik-Tauglich
Punkt e
12
Eine Bedienung mittels Pen & Tablet bringt zudem weitere Vorteile. Die Texteingabe
funktioniert analog dem Schreiben auf Papier, womit sich wohl die meisten Leute auskennen, und funktioniert im Vergleich zu den anderen getesteten Interfaces mindestens
gleich gut und schnell, wenn nicht sogar besser.
Auch Gesten können mit dem Pen effektiv von Hand gezeichnet werden. Die aktive
Fläche des Tablets hat ein Format im Verhältnis von 16:9, was auch dem Format eines
HD-TV’s entspricht, in Verbindung mit dem absoluten Modus in welchem das Tablet
betrieben wird kann so intuitiv richtig navigiert werden. Als schöner Nebeneffekt generiert ein Tip (Klick) mit dem Pen auch ein feines haptisches Feedback.
5.2 Zuordnung der Gesten & Funktionen
Die möglichen Funktionen wurden aufgrund der unter Punkt 3.3 getätigten Überlegungen festgelegt. Die Gesten zu den einzelnen Funktionen wurden auf Grund der unter
Punkt 3.4 getätigten Überlegungen festgelegt und so ausgewählt, dass sie ikonisch
und deiktisch am besten zu den jeweiligen Funktionen passen. Alle Funktionen und die
dazugehörigen Gesten sind in Abbildung Gesten zu finden.
Abbildung Zuordnung der Gesten & Funktionen
Browser -Funktionen
TV -Funktionen
Link klicken
Kanalwahl
URL eingeben
Vorheriger Sender
Back
Nàchster Sender
Forward
Volume Up
Bookmarks
Volume down
Home
Bookmarks
Neuer Bookmark
Home
Refresh
Neuer Bookmark
Stop
Main App-Zoom
Link in neuem Tab
toggle Info
Text kopieren
URL eingeben
Scrollen nach oben
Scrollen nach unten
Scrollen nach links
Scrollen nach rechts
Seitenanfang
Seitenanfang rechts
Seitenende
Seitenende rechts
Einzoomen (CSS Zoom)
Auszoomen (CSS Zoom)
Fix-Zoom toggle
Main App-Zoom
toggle Info
5.0 Das wantee-Konzept
5.3 Bedienung von wantee mittels Pen & Tablet
Im Folgenden soll kurz die Bedienung von wantee mittels Pen & Tablet erläutert
werden. Siehe hierzu auch Anhang 3: Kurzanleitung.
Bewegen des Cursors:
Um den Cursor zu bewegen wird der Pen circa 3 -5 mm oberhalb des Tablets bewegt,
der Stift soll das Tablet nicht berühren
Klicken:
Ein Klick wird durch einmaliges kurzes Antippen des Tablets mit dem Stift ausgeführt.
Nachfolgend wird ein Klick deshalb als Tip bezeichnet.
Doppelklicken:
Ein Doppelklick wird durch zweimaliges, kurz aufeinanderfolgendes Tippen auf das
Tablet ausgeführt. Nachfolgend wird ein Doppelklick deshalb als Doppel-Tip bezeichnet.
Draggen:
Um den Inhalt einer Webseite zu draggen wird der Pen an der gewünschten Position
leicht auf das Tablet gepresst und sogleich auch die vordere, respektive untere Taste
auf dem Pen betätigt. Solange der Pen nicht angehoben wird kann nun der Inhalt gedraggt werden.
Zeichnen einer Geste:
Um eine Geste zu zeichnen wird der Pen leicht auf das Tablet gepresst und dann kurz
in dieser Position belassen. Nach etwa einer Sekunde erscheint ein Ring um den Cursor welcher anzeigt, dass nun eine Geste gezeichnet werden kann. Sodann kann der
Stift ohne ihn anzuheben auf dem Tablet bewegt und die Geste gezeichnet werden. Ist
das Zeichnen der Geste beendet, wird der Stift wieder vom Tablet abgehoben, die der
Geste entsprechende Aktion wird ausgeführt insofern sie erkannt wurde.
Ausführen eine Flicks:
Um einen Flick auszuführen wird der Pen schnell und mit einer nur ganz sanften Berührung in der gewünschten Richtung über das Tablet gezogen. Flicks werden am besten
aus dem Handgelenk heraus ausgeführt, die Bewegung gleicht ungefähr dem flüchtigen Unterstreichen eines Wortes mit einem Stift auf Papier.
Fortgeschrittenes Zeichnen einer Geste:
Fortgeschrittenen Nutzern steht auch eine zweite Variante zur Verfügung: Solange
die hintere respektive obere Taste auf dem Pen gedrückt wird kann eine Geste direkt
gezeichnet werden, ohne dass der Pen das Tablet berühren muss. Dies funktioniert analog zum Bewegen des Cursors, so kann auch eine Geste schnell gezeichnet werden.
5.4 Bedienung von wantee mittels Toucheingabe
wantee kann teilweise auch mittels Touch-Eingabe bedient werden, um die Benutzung zu vereinfachen. Generell können mit den Fingern der Cursor gesteuert, gescrollt
oder simple Gesten benutzt werden. Da in dieser Arbeit der Hauptfokus aber auf der
Kontrolle von wantee durch Pen & Tablet liegt, wird nicht näher darauf eingegangen.
Welche Funktionen durch Toucheingabe gesteuert werden können wird in den Abschnitten zu den einzelnen Modulen erklärt.
5.5 Areas
Die Grundstruktur von wantee und somit auch die oberste Menü-Hierarchie besteht
aus 9 gleichwertigen Areas (Abb. siehe Anhang 4), wovon eine auf einmal aktiv (d.h.
bildschirmfüllend im Vordergrund) sein kann. In jeder Area kann ein Modul auf einmal
aktiv sein, wobei es keine Rolle spielt, ob es sich dabei um ein Web-, Bookmarks- oder
TV-Modul handelt. Es können so also beispielsweise 9 Webmodule gleichzeitig geöffnet werden, oder es kann eine beliebige Mischung erstellt werden: in 4 Areas können
4 Web-Module mit vier unterschiedlichen Webseiten geladen sein, in 4 weiteren Areas
werden in 4 TV-Modulen vier verschiedene TV-Sender angezeigt, und in der verbleibenden neunten Area ist gerade ein Bookmarks-Modul aktiviert.
Um zwischen einzelnen Areas wechseln zu können, wird die Area-Überblicksansicht
aufgerufen. Dies geschieht mittels der “A“-Geste, welche immer benutzt werden kann,
egal, welche Area oder welches Modul gerade aktiv ist. Die momentan aktive Area wird
sodann ausgezoomt, bis alle 9 Areas in der Überblicksansicht (also in ausgezoomtem
Zustand) nebeneinander in der eigentlichen Applikation schweben. Jede ausgezoomte
Area stellt weiterhin ihren momentanen Inhalt dar, so dass der Nutzer sehen kann,
welche Area mit welchem Inhalt er als nächstes aktivieren möchte.
Eine Area wird mittels eines Tip’s auf die ausgezoomte Area aktiviert, was bedeutet,
dass die angewählte Area einzoomt, bis sie den Screen wieder vollständig füllt.
5.6 Hauptmodule
Web-Modul
Das Web-Modul (Abb. siehe Anhang 4) ist eigentlich der Hauptbestandteil von wantee,
da hiermit der Zugriff auf das Internet und auch die Navigation im Web bewerkstelligt
wird. In einem Web-Modul (und somit auch in einer Area) kann eine Website auf einmal
geöffnet werden, Tabs oder ähnliches existieren nicht, weitere Webseiten können in
anderen Areas geöffnet werden.
Das Web-Modul kommt völlig ohne GUI aus, da sämtliche Aktionen im Browser mittels
Gesten kontrolliert werden. Als einziges grafisches Element wird während des Ladens
einer Seite eine Ladeanzeige überblendet. Ansonsten wird die geladene Webseite bildschirmfüllend angezeigt.
5.0 Das wantee-Konzept
5.6 Hauptmodule
Ein Link auf der Webseite wird mittels eines Tip’s darauf aktiviert, die aufgerufene Seite
wird im selben Web-Modul geöffnet, auch wenn der Link in HTML per target=“_blank“
eine neue Seite erzwingt. Dies aus dem Grund, dass es nur dem Nutzer erlaubt ist,
Areas zu wechseln, damit er die volle Kontrolle behält. Will der Nutzer einen Link in
einer anderen Area öffnen, so kann er den Link mittels Pen drücken (nicht tippen) und
zu draggen beginnen. Es erscheint ein Hilfslayer, in welchem eine kleine Übersicht aller
Areas (ähnlich der Area-Überblicksansicht) angezeigt wird. Der gedraggte Link kann
nun auf die gewünschte symbolisch dargestellte Area gezogen werden. Wird der Link
in der linken Hälfte der symbolische Area plaziert springt man sofort zur entsprechenden Area, in welcher der gedraggte Link ein einem Web-Modul geladen wird. Wird
der Link in der rechten Hälfte der symbolischen Area plaziert bleibt man in der aktiven
Area, der Link wird im Hintergrund in der gewählten Area geladen, zu welcher man zu
einem späteren Zeitpunkt wechseln kann.
Bookmarks-Modul
Das Bookmarks-Modul (Abb. siehe Anhang 4) bietet, wie der Name schon sagt, Zugriff
auf alle Bookmarks, wobei Bookmarks klassisch Links, aber auch Verknüpfungen zu
TV-Kanälen, Widgets, Web-Services etc. sein können. Es ist in zwei Spalten aufgeteilt:
in der linken Spalte befinden sich anwählbare Tags und Ordner, welche mittels eines
Tip’s die entsprechenden Bookmarks in der rechten Spalte laden.
Der Inhalt beider Spalten kann mittels Flicks gescrollt werden.
Alle Bookmarks enthalten zur besseren visuellen Identifizierung einen Screenshot respektive ein Logo oder Icon ihres Ziels. Um einen Bookmark aufzurufen muss er lediglich angetippt werden, das entsprechende Modul öffnet sich automatisch.
TV-Modul
Im TV-Modul (Abb. siehe Anhang 4) können sämtliche TV-Kanäle oder auch OnlineFilm-Dienste, DVD’s etc. angezeigt werden. Durch einen Tip auf den Inhalt wird das
Kanal-Hilfsmodul überblendet, in welchem Bookmarks mit Verknüpfungen zu TV-affinen Inhalten wie z.B. TV-Sendern angezeigt werden. Mittels eines Tip’s auf einen Bookmark wird der entsprechende Kanal geladen, wird einfach ins Leere getippt verschwindet das Kanal-Hilfsmodul wieder.
Die Kanäle können mittels Flicks vor- und zurück-gezapped werden, auch die Lautstärke wird mittels vertikalen Flicks kontrolliert.
Im TV-Modul ist zusätzlich auch eine Kontrolle per Toucheingabe möglich, da es etwas
umständlich ist, den Pen in die Hand nehmen zu müssen, nur um den Kanal umzuschalten oder die Lautstärke zu verändern. Das Kanal-Hilfsmodul kann durch tippen mit
den Fingern aktiviert und desaktiviert werden. Die Kanäle können mittels Touch-Flicks
vor- und zurück-gezapped werden, die Lautstärke wird mittels vertikalem Scrollen
kontrolliert.
5.7 Hilfsmodule
Hilfsmodule werden bei Aufruf oder kontextabhängig über das jeweils aktive Modul
überblendet.
URL-Hilfsmodul
Das URL-Hilfsmodul (Abb. siehe Anhang 4) erlaubt die Eingabe und Bearbeitung einer
URL und kann zudem als Suchbegriffseingabe verwendet werden.
Um eine URL einzugeben wird direkt mit dem Pen per Handschrift in das URL-Feld
geschrieben, erkannte Ziffern werden in der Systemschrift dargestellt. Um falsch
geschriebene Ziffern zu korrigieren können diese einfach überschrieben werden.
Um Ziffern oder ganze Wörter zu löschen werden diese von rechts nach links durchgestrichen, alternativ kann hierzu auch der Radierer am oberen Stiftende eingesetzt
werden. Um eine zusätzliche Ziffer einzufügen wird an der entsprechenden Stelle von
oben nach unten ein Trennstrich gezeichnet. Um ein Leerzeichen zwischen zwei Ziffern
oder Wörtern zu entfernen können diese mit einem Bogen verbunden werden.
Alternativ können auch die am oberen Rand positionierten Buttons zur URL- respektive
Textbearbeitung eingesetzt werden, da sie z.B. in URL’s häufig vorkommende Zeichenketten wie “www.“ oder “.com“ direkt einfügen.
Wird anstatt einer gültigen URL einfach ein Begriff eingegeben, startet automatisch
eine Websuche mit der in den Einstellungen angegebenen Suchmaschine.
Direkt oberhalb des Eingabefeldes wird jeweils (falls vorhanden) die URL der aktuellen Website angezeigt. Diese kann einfach über einen Tip darauf in das Eingabefeld
übernommen und gegebenenfalls bearbeitet werden.Direkt unterhalb des Eingabefeldes werden 6 dem momentan eingegebenen Text entsprechende KomplementierungsVorschläge angezeigt, welche URL’s aus dem Verlauf, Bookmarks, früheren Suchbegriffen etc. generiert werden. Um sie zu übernehmen reicht ein Tip auf den gewünschten
Vorschlag.
Drag-Hilfsmodul
Erlaubt das Draggen eines Links auf eine bestimmte Area. Je nachdem ob das Ziel auf
die linke Seite der symbolisierten Area oder auf die rechte gezogen wird, öffnet sich
automatisch die entsprechende Area oder das Ziel wird im Hintergrund geladen.
Such-Hilfsmodul
Das Such-Hilfsmodul wird identisch wie das URL-Hilfmodul bedient, enthält aber keine
URL-spezifischen Buttons und ist eher für eine Suche innerhalb der Bookmarks gedacht. Es kann aber auch generell zur Eingabe eines Suchbegriffs verwendet werden,
es startet automatisch eine Websuche mit der in den Einstellungen angegebenen
Suchmaschine.
6.0 Der wantee-Prototyp
Der Prototyp von wantee wurde aufgrund der Überlegungen unter Punkt 4.3 komplett
mittels Adobe Air respektive Flash und ActionScript realisiert. Analog zum Konzept ist
auch der Prototyp modular aufgebaut, alle Module wurden mehr oder weniger separat
erstellt und in der eigentlichen wantee-Applikation zusammengefügt.
Die Gesten-Erkennung wurde mittels StrokeIt(Web27) realisiert, welches die erkannten
Gesten mittels Tastatur-Code ausgibt, die sodann in Flash abgefragt und verarbeitet
werden. Der Textinput respektive die Handschriften-Erkennung wird von Windows7
übernommen.
Der Prototyp enthält in der ersten Version, mit welcher auch die Evaluation durchgeführt wurde, folgende Features:
-funktionsfähiges Web-Modul
-funktionsfähiges URL-Modul
-funktionsfähiges Bookmarks-Modul
-mittels Gesten steuerbar, allerdings ohne Flicks, die Gesten wurden deshalb im Gegensatz zum Konzept angepasst (Siehe hierzu Gesten Proto1)
-Gesten können nur durch drücken der oberen Pen-Taste ausgeführt werden, der Pen
sollte das Tablet nicht berühren.
-Die Touchfunktionalität konnte nicht in den Prototypen integriert werden
7.0 Evaluation
7.1 Testpersonen
Der Prototyp wurde in verschiedenen Stadien mit unterschiedlichen Personen getestet,
weshalb die Evaluation nicht völlig konsistent ist. Eine Person nutzt das Internet nur
sporadisch, die meisten anderen Personen waren sich die Benutzung des Internets
gewohnt, können aber nicht alle als Pro-User angesehen werden. Die meisten der
Testpersonen haben noch nie mit einem Stift-Tablet gearbeitet.
7.2 Pen & Tablet
Handling
Wie sich gezeigt hat, bedingt die Bedienung eines Stift-Tablets eine gewisse Einarbeitungszeit. Wichtig ist hier vor allem, dass Personen, welche erstmals ein Stift-Tablet
benutzen darauf hingewiesen werden, dass der Stift nicht ständig das Tablet berühren
muss, sondern normalerweise 3-5mm oberhalb des Tablets bewegt wird und nur zum
Ausführen eines Klicks auf das Tablet gedrückt werden muss. Nach einer Zeit von ca.
2-10min hatten sich aber bereits alle Testpersonen an die Handhabung gewöhnt.
Absolute Positionierung
Dem Grossteil der Testpersonen ist gar nicht aufgefallen, dass die Positionierung der
Mauspfeils im absoluten Modus stattfindet, d.h. die Position des Stiftes auf der TabletFläche entspricht 1:1 der Position des Mauszeiger auf dem Screen. Auf die absolute
Positionierung angesprochen haben diese die meisten Personen als intuitiv und angenehm empfunden, v.a. da das oftmalige Nachziehen/ Repositionieren wie es bei einer Maus häufig vorkommt entfällt. Die Tablet-Grösse respektive der darauf zurückzulegende Weg in Korrelation zu einer Screen-Auflösung von 1920x1080 scheint vernünftig
zu sein. Es müssen weder allzu grosse Bewegungen mit der Hand ausgeführt werden
noch leidet die Präzision der Mauszeigerpositionierung.
Pen-Tasten
Auch an die Benutzung der Pen-Tasten mussten sich die Testpersonen kurz gewöhnen, was aber auch innerhalb von 2-10min bis zu einem benutzbaren Grad möglich
war. Wichtig ist, dass der Benutzer den Stift in einer für ihn angenehmen Position hält
und evt. auch darauf hingewiesen wird, dass die Pen-Tasten sowohl mit dem Zeigefinger als auch mit dem Daumen bedient werden kann.
7.0 Evaluation
7.3 Gesten
Den meisten Nutzern war eine solche Gestensteuerung bisher unbekannt, sie stiess
jedoch meist auf Anklang, sobald erste Erfolge erzielt wurden. Der Vorteil von Gesten,
die Bedienung des Browsers schneller vonstatten gehen zu lassen, wurde von allen
Testpersonen erkannt.
Es hat sich jedoch auch hier gezeigt, dass die Gestensteuerung eine gewisse Einarbeitungszeit respektive Lernphase benötigt, welche in diesem Fall sehr unterschiedlich
waren. Einerseits müssen die Gesten zuerst gelernt oder verstanden werden, auch die
Logik hinter ähnlichen Gesten muss zuerst durchschaut werden, was aber im Normalfall relativ schnell gelang. Andererseits muss auch die Ausführung der Gesten, also
wie und auch wie präzise sie gezeichnet werden müssen zuerst erprobt werden, was
von Testperson zu Testperson zu sehr unterschiedlichen Ergebnissen geführt hat. Die
meisten Testpersonen haben sich gewünscht, dass die Gesten effektiv auf dem Tablet
gezeichnet werden können, was im finalen Prototyp auch realisiert werden konnte.
Gesten, welche Richtungen zeigen und auch richtungsorientierte Aktionen auslösen
wurden am schnellsten verstanden (z.B. Geste “Oben” = nach oben Scrollen). Gesten,
welche Buchstaben imitieren, wurden besser verstanden, wenn auch die dem Buchstaben zugrunde liegende Aktion mit dem Buchstaben an sich und auch der Benennung der Aktion erkannt wurde (z.B. u-Geste um die URL-Eingabe aufzurufen). Zudem
kam mehrmals der Wunsch nach einer optischen Hilfe auf, welche zu Beginn einer
Geste eingeblendet wird und sodann die möglichen Gesten aufzeigt.
7.4 Texteingabe mittels Pen
Die Texteingabe mittels Pen war wie auch die Benutzung eines Pens an sich für die
meisten Testpersonen Neuland, scheint aber im Grossen und Ganzen akzeptiert zu
werden, auch wenn Anfangs einige Nerven nötig zu sein scheinen. Da im Prototyp
die Tablet-Eingabe-Funktion von Windows verwendet wird, habe ich keinen grossen
Einfluss auf die hierbei bestehenden Möglichkeiten. Es hat sich jedoch gezeigt, dass
für Anfänger der Ziffern- Modus, in welchem jede Ziffer einzeln in ein abgegrenztes Feld
geschrieben wird, am besten zu funktionieren scheint. Für die fliessende Texteingabe
müssen zuerst die Macken des Systems erkannt und bestenfalls auch ein personalisiertes Handschriften-Erkennungs-Training absolviert werden.
7.5 Buttons
Tests zur minimalen noch klickbaren Fläche haben ergeben, dass sogar TabletAnfänger dank der grossen Präzision des Pens sogar noch sehr kleine Buttons von
nur 10x10 Pixel relativ genau treffen können. Um die Bedienung zu erleichtern sollten
klickbare Flächen aber nach der Ansicht der Testpersonen mindesten ca. 30x30 Pixel
gross sein, wobei ich diese aber schlussendlich wesentlich grösser gestaltet habe, um
sie Nutzerfreundlicher zu machen.
7.6 Schriftgrösse
Die Tests zur gut lesbaren Schriftgrösse haben ergeben, dass die meisten Testpersonen Text bereits ab einer Grösse von 18pt lesen können, was aber je nach Schrift
ein bisschen unterschiedlich war. Die Lesbarkeit von Lauftext wurde nicht eruiert, da
Lauftext wohl nur als Inhalt von Webseiten vorkommen wird, bei welchem die Schriftart
nicht manipuliert werden kann (durch Webseite an sich vorgegeben). Die Schriftgrösse
von Lauftext in Webseiten kann durch den Benutzer mittels CSS-Zoom selbst festgelegt werden.
Schrift: Veto Com, Regular
- knapp lesbar ab 18pt
- gut lesbar bei 24-26 pt
- optimale Schriftgrösse 22-28pt
Schrift: infoOTText, Regular
- knapp lesbar ab 20pt
- gut lesbar bei 26 pt
- optimale Schriftgrösse 24-30pt
Schrift: Titilium Maps, Regular
- knapp lesbar ab 18pt
- gut lesbar bei 24pt
- optimale Schriftgrösse 22-28pt
8.0 Finaler wantee-Prototyp
Anpassungen aufgrund der Evaluation:
-die Standard-Schriftgrösse wurde auf 26pt festgelegt
-die Button-Mindestgrösse wurde auf 90x90px korrigiert
-Gesten können nun effektiv auf dem Tablet gezeichnet werden, es muss keine Taste
gedrückt und auch der Pen nicht oberhalb des Tablets bewegt werden
Des Weiteren wurde im finalen Prototyp zusätzlich noch das TV-Modul implementiert, zudem können nun Flicks und somit auch diejenigen Gesten, welche im Konzept
beschrieben sind, verwendet werden. Nicht zuletzt wurden auch noch viele Bugfixes
vorgenommen.
9.0 Fazit
Obwohl ich während des ganzen Projekts immer wieder vor allem mit technischen
Schwierigkeiten zu kämpfen hatte, bin ich schlussendlich mit dem Endresultat zufrieden. Dies vor allem deshalb, da ich von Leuten welche den wantee-Prototypen ausprobiert haben grösstenteils positives Feedback erhalten habe.
Die meisten Testpersonen konnten den Prototypen nach ein wenig Einarbeitungszeit
bedienen. Klar ist jedoch, dass eine sofortige intuitive Bedienung nicht möglich ist,
ohne das Tablet und den Pen als Eingabegerät zu beherrschen und die minimal notwendigen Gesten verstanden zu haben, was jedoch meist erstaunlich schnell ging.
Auch hat sich allen Testpersonen die Funktionalität des Prototyps relativ schnell erschlossen. Bis auf wenige könnten sich alle vorstellen, eine solche Anwendung im
gedachten Kontext (also z.B. auf einem TV im Wohnzimmer) zu benutzen und auch
mittels eines Pen’s zu bedienen.
10.0 Anmerkungen
[1] TUIO ist ein Community-Standard für die Entwicklung von tangiblen User Interfaces, auf der TUIO-Online-Platform werden verschiedene Programme und Code angeboten, welche das Arbeiten mit Touch-Interfaces und ähnlichem erleichtern. Siehe auch:
http://www.tuio.org/
[2] OSC, Open SoundControl, ist ein Protokoll für die Kommunikation zwischen Computern, Synthesizern und weiteren Multimedia-Geräten über das Netzwerk. Siehe auch:
http://opensoundcontrol.org
[3] Die Levenshtein-Distanz zwischen zwei Zeichenketten ist die minimale Anzahl von
Einfüge-, Lösch- und Ersetz-Operationen um die erste Zeichenkette in die zweite
umzuwandeln. Benannt ist die Distanz nach dem russischen Wissenschaftler Wladimir
Lewenstein, der sie 1965 einführte. Siehe auch : http://de.wikipedia.org/wiki/Levenshtein-Distanz
[4] Der Begriff Gestik bezeichnet die Gesamtheit aller Gesten, wobei unter einer Geste
hauptsächlich nonverbale Kommunikation verstanden wird. Im alltäglichen Gebrauch
werden vor allem Arme und Hände zum Gestikulieren verwendet. Gestik kann sprachersetzend oder auch sprachbegleitend eingesetzt werden, hierbei werden Gesten oft
auch unbewusst benutzt. Es können verschiedene Arten von Gestiken unterschieden
werden:
Lexikalische Gesten
Lexikalische Gesten sind erlernte Gesten, wie z.B. das Winken mit der Hand als
Zeichen der Begrüssung, sie funktionieren wie Wörter einer Lautsprache (vgl.
Königs:3).
Koverbale Gesten
Koverbale Gesten sind die sprachbegleitenden Gesten, welche oftmals die Aussagen eines Redners unterstreichen und die Vermittlung von Emotionen verstärken (vgl.
Königs:3).
Ikonische Gesten
Ikonische Gesten bilden meist reale Objekte und Formen ab, beispielsweise einen Rahmen, welcher einen Bereich markiert (vgl. Königs:3). Auch die z.B. auf dem iPhone verwendeten Gesten zum Zoomen, Rotieren etc. gehören zu den ikonischen Gesten, oder
wie in diesem Projekt von Wichtigkeit, Gesten, welche sich an Buchstaben orientieren.
Deiktische Gesten
Deiktische Gesten sind Zeigegesten, mit welchen beispielsweise auf Personen, Objekte oder in eine Richtung gedeutet wird. Sie sind kulturell unabhängig und besonders
intuitiv anwendbar (vgl. Königs:3).
11.0 Quellenverzeichnis
11.1 Weblinks
01 http://www.betanews.com/article/Windows-Embedded-Standard-7-released-is-it-ready-for-TV-yet/1272399154
02 http://www.betanews.com/article/Windows-Embedded-Standard-7-released-is-it-ready-for-TV-yet/1272399154
03 http://www.pctipp.ch/index.cfm?pid=1317&pk=51320
04 http://www.peopleoflava.com/television/scandinavia/
05 http://connectedtv.yahoo.com/
06 http://www.nytimes.com/2010/03/18/technology/18webtv.html
07 http://www.engadget.com/2010/04/29/google-sony-intel-and-logitechs-tv-project-to-be-unveiled-next/
08 http://www.celloiviewer.com/
09 http://www.spiegel.de/netzwelt/gadgets/0,1518,637660-2,00.html
10 http://people.zhdk.ch/tobias.koller/BAprocess/?p=431
11 http://people.zhdk.ch/tobias.koller/BAprocess/?p=433
12 http://www.engadget.com/2010/04/29/google-sony-intel-and-logitechs-tv-project-to-be-unveiled-next/
13 http://www.textratech.com/SoftwareHowItWorksAnim.htm
14 http://www.logitech.com/de-at/keyboards/keyboard/devices/3848
15 http://www.itechnews.net/2009/11/25/wireless-handheld-keyboard-with-touchpad/
16 http://www.trust.com/products/product.aspx?artnr=14909
17 http://www.loopygadgets.com/msi-air-keyboard-mouse/
18 http://glidetv.com/
19 http://www.ergo2work.de/products/de/contour-rollermouse.html
20 http://www.wacom.eu/index2.asp?pid=294&lang
21 http://nuigroup.com/forums/viewthread/8933/P0/
22 http://www.benchun.net/flosc/
23 http://www.bytearray.org/?p=91
24 http://people.zhdk.ch/tobias.koller/BAprocess/?p=463
25 http://www.wacom.eu/index2.asp?pid=294&lang=de&spid=1
26 http://www.visionobjects.com/handwriting_recognition/onlinestore.htm
27 http://www.tcbmi.com/strokeit/
11.2 Literaturverzeichnis
Arnall, Timo (2008) : The Web in the World. Vortrag, Web Expo 2.0, Berlin,
http://www.slideshare.net/tmo/the-web-in-the-world-presentation
Dourish, Paul (2001) : Where the action is : the foundation of embodied interaction. MIT Press, Cambridge, Ma.
Greenfield, Adam (2006) : Everyware – The dawning age of ubiquitous computing. New Riders, Berkeley CA
Hinckley, Ken (2008):Input technologies and techniques, in: Sears, Andrew / Jacko, Julie (Hrsg.): The Human Computer Interaction Handbook, New York, 2008, S. 161-176.
IBM (2009) : Innovationen – Ein smarter Planet, http://www-05.ibm.com/innovation/ch/
introduction_signs.html
Königs, Bastian (2005): Interaktion mittels Gestik, Animation. Universität Ulm, S.1-13.
Lipp, Lauritz L. (2004) : Interaktion zwischen Mensch und Computer im Ubiquitous Computing. LIT Verlag, Münster
McCullough, Malcolm (2004) : Digital Ground – Architecture, Pervasive Computing, and Environmental Knowing. MIT Press, Cambridge, Ma.
Page, Will (2009) : The long tail of P2P, in: Economic Insight No, 14 /09
http://www.prsformusic.com/creators/news/research/Documents/
Rinott, Michal (2005) : SonicTexting. Interaction Design Institute Ivrea, S.1-2.
Tao, Xiaoming (2005) : Wearable electronics and photonics. Woodhead Publishing, Cambridge
Yang Cai, Julio Abascal (Hrsg.) (2006) Ambient Intelligence in Everyday Life. Springer Verlag, Berlin Heidelberg
12.0 Anhang
12.1 Anhang 1 : Grafiken zu den Usertests : User 1
Nutzungszweck
Organisation
Private Nutzung
Skype / Chat
Word etc.
Facebook
Mail
YouTube
Recherche
Spassbrowsen
Online Games
Online einkaufen
News
Links zeigen
Blogs
Filme streamen
Videos zeigen
Partykalender
Musik hören
2
Öffentliche Nutz.
Musik-Videos
3
4
Arbeit
Info
5
6
Sozial
Spass
12.1 Anhang 1 : Grafiken zu den Usertests : User 2
Nutzungszweck
Organisation
Private Nutzung
Skype / Chat
Word etc.
Facebook
Mail
YouTube
Recherche
Spassbrowsen
Online Games
Online einkaufen
News
Links zeigen
Blogs
Filme streamen
Videos zeigen
Partykalender
Musik hören
2
Öffentliche Nutz.
Musik-Videos
3
4
Arbeit
Info
5
6
Sozial
Spass
12.0 Anhang
12.1 Anhang 1 : Grafiken zu den Usertests : User 3
Nutzungszweck
Organisation
Private Nutzung
Skype / Chat
Word etc.
Facebook
Mail
YouTube
Recherche
Spassbrowsen
Online Games
Online einkaufen
News
Links zeigen
Blogs
Filme streamen
Videos zeigen
Partykalender
Musik hören
2
Öffentliche Nutz.
Musik-Videos
3
4
Arbeit
Info
5
6
Sozial
Spass
12.2 Anhang 2 : Moodboard
12.0 Anhang
12.3 Anhang 3 : wantee-Kurzanleitung
12.4 Anhang 4 : Screenshots : Areas
12.0 Anhang
12.4 Anhang 4 : Screenshots : Web-Module
12.4 Anhang 4 : Screenshots : Bookmarks-Modul
12.0 Anhang
12.4 Anhang 4 : Screenshots : TV-Module
12.4 Anhang 4 : Screenshots : URL-Module