wantee Thesis
Transcription
wantee Thesis
Interaction Design wantee Bachelor Thesis Tobias Koller [email protected] Mentoren : Karmen Franinovic, Gerhard M. Buurman Interaction Design Program FS 2010 Zurich University of the Arts 0.0 Inhaltsverzeichnis 1. Einleitung 2. Hintergrund-Recherche 2.1 Projekte in Planung 2.2 Bestehende Produkte und Lösungen 2.3 Interfaces & Textinput 3. Kontext-Recherche 3.1 Nutzer-Befragung und Analyse 3.2 Moodboard 3.3 Funktionsumfang des Browsers 3.4 Gestik als Inputmethode 3.5 Anforderungen an das Interface 4. Tests und Experimente 4.1 On-Screen-Keyboard 4.2 Keyboard-Trackball-Kombination 4.3 Adobe-Air-basierter Browser 4.4 Touchpad 4.5 Pen & Tablet, Handschriftenerkennung 5. Das wantee-Konzept 5.1 Wahl des Interfaces 5.2 Zuordnung der Gesten & Funktionen 5.3 Bedienung von wantee mittels Pen & Tablet 5.4 Bedienung von wantee mittels Toucheingabe 5.5 Areas 5.6 Hauptmodule 5.7 Hilfsmodule 6. Der wantee-Prototyp 7. Evaluation 7.1 Testpersonen 7.2 Pen & Tablet 7.3 Gesten 7.4 Texteingabe mittels Pen 7.5 Buttons 7.6 Schriftgrösse 8. Finaler wantee-Prototyp 9. Fazit 10. Anmerkungen 11. Quellenverzeichnis 11.1 Weblinks 11.2 Literaturverzeichnis 12. Anhang 1.0 Einleitung Kurzbeschrieb wantee vereint Web & TV, ist mittels Gesten steuerbar und ermöglicht ein komfortables gemeinsames Erlebnis unterschiedlichster Medieninhalte in angenehmer Umgebung… Thematik wantee ist vor dem Hintergrund des “Web in the World”, also wie das Web an sich in das alltägliche Leben integriert ist oder sein könnte, entstanden. Generell durchdringen das Web, Inhalte daraus oder auch Verknüpfungen ins Web immer stärker den Alltag, bis auf wenige Ausnahmen trifft dies aber nicht auf den Bereich des TV zu. Die grundlegende Frage für das Konzept hinter wantee war also, warum das Web bis anhin nicht auf den Fernseher gekommen ist, wofür wantee sowohl Antworten als auch Lösungen bieten soll. Zur Namensgebung Das Konzept respektive der Prototyp trägt den Namen “wantee“, welcher eine lautmalerische Verbindung der Wörter “Web and TV“ ist und im englischen Slang auch “etwas, das man gerne hätte“ bedeutet. Zu dieser Arbeit Zugunsten der Gliederung wurde nicht auf einen stringenten zeitlichen Ablauf, wie er in realität bei diesem Projekt passiert ist, geachtet. Es kann deshalb sein, dass im Text Schlussfolgerungen Aufgrund von Experimenten etc. gezogen werden, welche erst später in dieser Arbeit erwähnt werden. 2.0 Hintergrund-Recherche 2.1 Projekte in Planung Google TV Google plant in Kooperation mit Intel, Sony und weiteren TV-Produzenten das Web über den Fernseher ins Wohnzimmer zu bringen (vgl. Web06, Web07, Web12). Dies soll einerseits über spezielle Set-Top-Boxen, andererseits über neu entwickelte TV’s geschehen und auf Googles Android basieren. Die Interface-Hardware hierzu soll von Logitech entwickelt werden, wobei gerüchteweise von QWERTY-Fernbedienungen die Rede ist, also von Fernbedienungen mit einer (kleinen?) Tastatur. Welche Form diese genau haben sollen ist zum momentanen Zeitpunkt jedoch nicht bekannt. Auch nicht bekannt ist, wie das System von Google genau funktionieren soll, ob ähnlich wie bei anderen Projekten (vgl. auch Yahoo! Connected TV, Cello TV) Widgets zum Einsatz kommen sollen oder ob eher eine Variante des Google-Browsers “Chrome“ im Verbund mit Online-Applikationen und Cloud-Computing als Basis für die Einbindung des Internets benutzt werden soll. Hierbei besonders interessant für meine Arbeit erscheint mir, dass Google davon ausgeht, dass immer mehr Leute Internet auf ihren TV’s nutzen wollen, zumindest so viele, dass sich für Google ein lukratives Werbegeschäft aufzutun scheint. Windows 7 Embedded Windows 7 soll als “Windows Embedded Standard 7” bald für diverse Geräte wie Fernseher oder Settop-Boxen zur Verfügung stehen (vgl. Web01). In Win Embedded sollte auch der Internet Explorer integriert sein, was eigentlich die Möglichkeit des Browsens auf dem TV eröffnen könnte. Wie dies auf einem TV genau geschehen soll ist aber momentan nicht eruierbar. Ein aktuelles Demonstrationsvideo(vgl. Web02) auf einem Fernseher zeigt Menüpunkte wie “Internet TV” und “Internet Media” auf, welche aber alle nur den Zugriff auf TV-affine Inhalte erlaubt. Im Video ist zwar auch ein Internet Explorer-Icon zu sehen, leider wird dieser jedoch nicht gestartet. Was für eine Art Interface verwendet wird ist ebenfalls nicht ersichtlich. Laut einer Medienankündigung wird es bald Windows-7 zertifizierte Fernseher von Toshiba geben (vgl. Web03). Sie bieten Full-HD-Bildschirm mit einer LAN-Schnittstelle (der WWW-Anschluss ist also gegeben) und zwei USB-Ports. Einen Steckplatz belegt ein USB-Funkadapter, über den der Fernseher zum Beispiel Videos vom Computer empfängt und wiedergibt. Dies soll mittels dem “Toshiba Media Controller” geschehen, welcher Multimediainhalte via DLNA vom PC auf den TV bringt. Leider ist aber auch bei dieser Ankündigung von einem auf dem TV benutzbaren Browser nichts Konkretes in Erfahrung zu bringen. 2.2 Bestehende Produkte & Lösungen Yahoo! Connected TV Die Lösung von Yahoo, um das Internet zumindest teilweise auf den Fernseher zu bringen, besteht aus Widgets (vgl. Web05). Diese können partiell Informationen aus dem Web darstellen oder verlinken auf TV-ähnliche Inhalte. Ein wichtiger Punkt ist hierbei, dass vor allem auch auf TV On Demand von beispielsweise “Amazon Video on Demand“ und “Blockbuster“ gesetzt wird. Aus meiner Sicht sind dies nette Features zur Erweiterung der TV-Funktionalität, aber noch meilenweit von einer Internet-Experience auf dem TV entfernt. Cello TV Der englische TV-Hersteller Cello Electronics hat einen Fernseher entwickelt, mit welchem man über einen integrierten Netzwerkanschluss Zugriff auf “iPlayer”, die Online-Mediathek von BBC, hat (vgl. Web08). Auch Dienste von anderen Anbietern wie YouTube, Disney etc. können direkt genutzt werden. Ein beliebiger Zugriff aufs Internet scheint aber nicht möglich zu sein, zudem sind auch hier die Inhalte eher TV- als Web-orientiert. Scandinavia Eine Firma namens “People of Lava (Sweden)” hat einen auf Googles Android-OS basierenden TV vorgestellt, welcher TV, Internet, Multimedia und Social Media in einem bieten soll(vgl. Web04). Auf ersten Bildern ist auch konkret eine Art Browser mit einer aufgerufenen Webseite zu sehen. Der Browser würde somit die folgenden Navigationspunkte direkt anwählbar einblenden: Suchen, Bookmarks, neues Fenster, Refresh, Forward (aber kein Back ?) und Home. Als Interface wird in den Spezifikationen ein Wireless-Keyboard mit Pointer/Maus angegeben, detaillierte Informationen dazu sind jedoch nicht auffindbar. Das System scheint App-basiert zu sein, d.h. der Browser ist ein App, ebenso wie Youtube, Google-Maps etc. Zudem scheinen auch Widgets für Wetterdaten etc. installiert zu sein. Da aber kein Video dazu aufzutreiben ist und der TV anscheinend auch noch nicht gekauft werden kann stellt sich mir die Frage, ob es sich bei den Produktbildern (inkl. Browser) eventuell nur um Fotomontagen handelt. Phillips Net-TV Phillips bietet bereits internetfähige TV’s an, in welche W-LAN und ein auf Opera basierender Browser integriert sind (vgl. Web09). Dieser kann dank CE-HTML speziell TV angepasste Inhalte, aber auch normale Webseiten anzeigen, wobei diese aber standardmässig im Mobile-Modus aufgerufen werden. Navigiert wird mittels einer Fernbedienung, Textinput wird in SMS-Manier über ein 12-stelliges Tastenfeld eingegeben, was die Bedienung des Browser etwas umständlich und langsam macht. 2.0 Hintergrund-Recherche 2.2 Bestehende Produkte & Lösungen Sony Playstation 3 Die Playstation 3 von Sony beinhaltet einen relativ vollständigen Browser (vgl. mein Test des Playstation-Browsers, Web10 ). Dieser lässt das Aufrufen beliebiger Webseiten zu und kann auch Flash-Content darstellen. Bedient wird er über das Standard-PlaystationGamepad, wobei mittels des einen Joysticks (oder der Richtungstasten) ein Mauscursor gesteuert und mittels des zweiten Joysticks der Content verschoben (gescrollt) werden kann. Ein Klick auf Links wird mittels der X-Taste ausgelöst. Die Texteingabe wird mittels eines Klicks in ein Eingabefeld gestartet und ruft ein Tastaturfeld auf, welches ebenfalls mittels des Joysticks bedient wird, indem man Ziffer für Ziffer ansteuert und sodann durch einen Klick auf die X-Taste die entsprechende Ziffer in eine Textzeile übernimmt. Ist der Text vollständig eingegeben, wird er über einen “Einfügen“-Button in das Eingabefeld im Browser übertragen und kann dann verwendet werden. Dieses System funktioniert zwar präzise, ist aber relativ langsam und gerade bei längerem Text deshalb beinahe unbrauchbar. Die zurück- und vor- Funktionen sind auf die vorderen (mit dem Zeigefinger bedienbaren) Tasten gelegt, wobei die linke Taste die zurück- Funktion und analog die rechte Taste die vor- Funktion ausführt. Weitere Funktionen wie zoomen, das Wechseln einer Seite, Aufrufen des Browsermenüs etc. werden auf die restlichen Tasten aufgeteilt. Nintendo Wii Die Wii-Konsole von Nintendo bietet einen auf Opera basierenden Browser, welcher dem Konzept gemäss mit der Wiimote gesteuert wird (vgl. mein Test des Wii-Browsers, Web11). Die Texteingabe funktioniert über ein On-Screen-Keyboard, auf welchem mittels Point& Click einzelne Ziffern nacheinander eingegeben werden können, indem man mit einem von der Wiimote gesteuerten Cursor auf den entsprechenden Buchstaben zeigt und diesen sodann durch einen Druck auf die grosse “A“-Taste der Wiimote in ein Textfeld übernimmt. Dieses System funktioniert intuitiv (wie meist auch die restliche Bedienung der Wii), da die Cursorbewegung aber nicht sehr präzise ist und die Ziffern-Buttons relativ klein sind muss mit häufigem Vertippen gerechnet werden. Dadurch kann Text nicht fliessend eingegeben werden, zudem ermüdet die Hand relativ schnell, wenn die Wiimote mit ihrem nicht ganz unerheblichen Gewicht über längere Zeit sehr präzise gehandhabt werden muss. Die Navigation im Browser erfolgt ähnlich, zum Öffnen eines Links wird auf diesen gezeigt und dann wiederum mittels der “A“-Taste ein Klick ausgelöst. Die vor- und zurück- Funktionen können am einfachsten in einem Menü aufgerufen werden, welches erscheint, sobald man den Cursor an den unteren Bildschirmrand bewegt. Um den Content zu scrollen wird auf eine einfache Gestik zurückgegriffen: mittels der Zeigefinger-Taste erscheint ein Kreis um den Cursor, von welchem aus sodann eine Linie in die zu scrollende Richtung gezogen und zugleich auch in die entsprechende Richtung gescrollt wird. Die Zoomfunktion ist auf die Plus- respektive Minus- Tasten der Wiimote gelegt, wobei automatisch markierte Passagen der Webseite (welche aufgrund der HTML-Struktur vom Browser selbständig identifiziert werden) beim Zoomen ins Zentrum gerückt werden. 2.3 Interfaces & Textinput Kombination von Tastatur mit Touchpad, Trackball, oder Akzelerometer Tastaturen an sich ermöglichen nebst Textinput prinzipiell eigentlich auch eine Navigation auf Webseiten. So kann beispielsweise mittels der Tabulator-Taste von Link zu Link gesprungen und dieser sodann mittels der Enter-Taste aktiviert werden, oder die Pfeiltasten (im NumLock-Modus auch der Zahlenblock) dienen zur Steuerung des Cursors. Da dies aber nicht wirklich praktikabel ist und zudem auch nicht auf jeder Webseite funktioniert werden, für dieses Projekt reine Tastaturen nicht in Betracht gezogen. Auf dem Markt sind aber auch zahlreiche Produkte erhältlich, welche eine Tastatur mit einem weiteren Maus-emulierenden Interface kombinieren. Im Zusammenhang mit dieser Arbeit am ehesten interessant erscheinen vor allem diejenigen, welche relativ klein sind. Auf einige unterschiedliche soll nachfolgend kurz eingegangen werden. Das Logitech DiNovo Mini-Keyboard (vgl. Web14) kombiniert eine kleine kabellose QWERTZ-Tastatur mit einem Clickpad (d.h. Pad mit vier Richtungspfeilen), welches auch als Touchpad benutzt werden kann. Mag die Tastatur noch treffsicher bedienbar sein, so fällt jedoch das Touchpad relativ klein aus, weshalb es wohl nicht zu einer flüssigen Steuerung eines Cursors benutzt werden kann. Auch eine Navigation mittels der Richtungstasten im Clickpad-Modus ist wohl eher zu bedienen von Menüs geeignet als zur Navigation eines Cursors . Das DiNovoMini kann mit beiden Händen gehalten und der Text mit den Daumen eingegeben werden. Ein weiteres Produkt (Hersteller unbekannt, vgl. Web15) bietet ebenfalls eine kabellose, kleine, vollständige Tastatur, jedoch in Kombination mit einem reinen, etwas grösseren Touchpad. Dieses ist jedoch oberhalb der Tasten angeordnet, was eine angenehme Bedienung erschwert. Zudem erscheint mir auch die Grösse dieses Touchpads noch als zu klein, um damit angenehm arbeiten zu können. Auch bei diesem Produkt kann Text mit den Daumen eingegeben werden. Eine Variante mit Trackball wird von Trust angeboten (vgl. Web16), welche jedoch etwas grösser ausfällt, so dass das Keyboard zur Texteingabe aufliegen muss. Links und rechts der Tastatur befinden sich leicht erhöht die weiteren Eingabeelemente, welche mit den Daumen bedient werden können, wenn das Keyboard in den Händen gehalten wird. Auf der linken Seite sind ein Scrollrad (nur vertikales Scrollen möglich) sowie einige Medien-Tasten (Play/Pause, Lautstärke etc.) integriert, auf der rechten Seite befindet sich ein Trackball. Die Maustasten befinden sich an der Front, auf der linken Seite die linke Maustaste (Primärklick), analog auf der rechten Seite die rechte Maustaste (Sekundärklick), welche mit den Zeigefingern bedient werden. Dieses Keyboard habe ich auf seine Funktionalität hin getestet, siehe hierzu Punkt 4.2. Eine Tastatur- Akzelerometer – Kombination bietet das MSI Air-Keyboard (vgl. Web17), welches nebst einer vollständigen Tastatur auch Medientasten enthält. Der Cursor wird über die Bewegung des gesamten Keyboards gesteuert, die Messung der Bewegung geschieht aber nur im relativen Modus (kein Pointing wie bei einer Wiimote) über einen Akzelerometer, was wohl eine schnelle, genaue Positionierung des Cursors verunmöglicht. 2.0 Hintergrund-Recherche 2.3 Interfaces & Textinput Textra Die Firma Textra (vgl. Web13) hat mit dem AZtext-Keypad und dem AZ-Pen eine gestenbasierte Variante zur Texteingabe erstellt, bei welcher aber nicht einfach Buchstaben “nachgemalt“ werden, sondern auf der das Alphabet aufgrund seiner Anordnung mit jeweils einer links, rechts, oben , unten oder links-oben, rechts-oben etc. Geste eingegeben werden kann. Was textuell erklärt ein wenig kompliziert tönt, kann auf der Webseite mit interaktiven Demos besser verstanden werden. Die gefundene Lösung erscheint schlicht, ist aber wohl eher für Handy-Tastaturen geeignet und benötigt wahrscheinlich einiges an Training, damit Text flüssig eingegeben werden kann. Keybong (Sonic Texting) Beim Sonic Texting (vgl. Rinott:1ff ) wird mittels des Keybongs (ein 8-Achsen-Joystick, welches ähnlich wie das Wii-Nunchuck mit einem Daumen bedient wird), Text über die Richtung des Joysticks eingegeben. Die momentan angewählte Ziffer wird dabei vom System vorgelesen und solange wiederholt, bis sich die Position ändert oder die Ziffer eingegeben wird. Die Ziffern sind auf 8 Achsen angeordnet, welche eine erste Auswahl generieren, bevor sich jede Achse in 5 weitere Unterachsen aufsplittet, auf welchen wiederum durch Ausrichtung des Joysticks in die entsprechende Richtung ein einzelner Buchstabe angewählt werden kann. Obwohl ich dieses Prinzip als sehr interessant empfinde, ist es wohl so kompliziert, dass es sich nur schwer und auch sehr langsam benutzen lässt. GlideTV GlideTV (vgl. Web18) wird von den Produzenten als “The worlds 1st couch mouse“ angepriesen. Es handelt sich hierbei um ein kleines Touchpad mit einigen Medientasten, welches in die Handfläche passt. Der Mauscursor wird mit dem Daumen gesteuert, ein Klick wird anscheinend mittels eines Tap’s ausgelöst. Texteingabe wird durch ein On-Screen-Keyboard realisiert, indem der Mauscursor auf eine Ziffer nach der anderen bewegt und geklickt werden muss. Obwohl dieses Touchpad angenehm in der Hand zu liegen scheint, bezweifle ich, dass der Cursor mit dem Daumen auf einer so kleinen Fläche präzise bewegt werden kann. Rollermaus Als weiteres, interessantes Interface soll auch noch kurz die sogenannte Rollermaus angesprochen werden, ein Mausersatz, welcher direkt unterhalb einer Tastatur plaziert werden kann. Die Navigation erfolgt über einen Rollstab, der Bewegungen auf dem Bildschirm in alle Richtungen zulässt. Der Rollstab bietet bequem allen Fingern beider Hände Platz. Geklickt werden muss mit den Daumen. Für eine Verwendung auf dem Sofa scheint mir dieses Prinzip nicht geeignet, da bei einer Benutzung auf dem Schoss die Handgelenke stark angewinkelt werden müssen. Abbildungen zu 2.2 & 2.3 DiNovo Mini Trust Hersteller unbekannt MSI Air KeyBong GlideTV 3.0 Kontext-Recherche 3.1 Nutzer-Befragung & Analyse In der Nutzer-Befragung wurden 3 Testpersonen beobachtet und befragt, welche auf die eine oder andere Art bereits Internet auf dem TV benutzen. Hierbei von Interesse war für mich vor allem, was die Vorteile und Nachteile ihrer momentan benutzten Setups sind, und wofür sie das Internet auf dem TV nutzen respektive nutzen würden, wenn ihre Setups oder mein geplanter Prototyp besser bedienbar wäre. Für alle Grafiken siehe Anhang 1. User & Setup 1 Das Setup der ersten Testperson ist wohl das technisch gesehen Einfachste: es besteht aus einem fix montierten Beamer, welcher auch zum Fernsehen benutzt wird, einem normalen Laptop und einer an den Laptop angeschlossenen Wireless-Maus. Die Laptop-Maus-Kombination funktioniert in sich und wird lediglich per Kabel an den Beamer angeschlossen. Zur Texteingabe wird die Tastatur des Laptops verwendet. Beim Surfen kommt ein für Computer gängiger Browser zum Einsatz. Dieses Setup wird vor allem verwendet, wenn mehrere Personen anwesend sind, um sich gegenseitig interessante Webseiten, YouTube-Videos etc. zu zeigen, was auf dem Laptop-Bildschirm mühsam ist. Zudem können zusammen Filme angeschaut werden, welche direkt aus dem Internet gestreamt werden. Auch in der Gruppe genutzt wird das gemeinsame Musikhören im Internet. Des Weiteren kann das Internet auf dem Beamer auch als Informationsquelle für z.B. aktuelle Partynews dienen, die Auswahl kann von allen anwesenden Personen betrachtet und diskutiert werden. Vorteile: - Beliebiger Computer anschliessbar - Gewohnter Browser - Alle Bookmarks vorhanden Nachteile: - Keine fixe Installation, somit kein spontaner Zugriff - Texteingabe sehr mühsam - Maus funktioniert nur bedingt auf Sofa - Keine Zoom-Funktion - Lesbarkeit abhängig von Auflösung User & Setup 2 Das Setup der zweiten Testperson besteht aus einem grossformatigem TV-Gerät, einem daran angeschlossenen Mac Mini und einer an den Mac angeschlossenen kabellosen Maus-Keyboard-Kombination. Der Mac Mini ist fix plaziert und dient effektiv nur der Nutzung des Internets sowie weiterer Medieninhalte am TV. Zum Surfen wird ein für Computer gängiger Browser verwendet. Ein grosser Vorteil dieser Installation besteht darin, dass der Mac Mini immer an den TV angeschlossen ist und somit relativ rasch und auch spontan auf das Internet zugegriffen werden kann. Der MacMini wird meist für den Zugriff auf eine Mediathek, aber auch zum Surfen im Internet verwendet. Die Steuerung mittels einer normalen Tastatur und Maus, welche meist auf einem Tisch vor dem Sofa plaziert sind, ist relativ unergonomisch. Vorteile: - Fixe Installation - Relativ schneller Zugriff - Auch andere Funktionen verwendbar - Gewohnter Browser - Alle Bookmarks vorhanden Nachteile: - Texteingabe unergonomisch - Maus funktioniert nur bedingt auf Sofa - Nur normale Apple-Zoom-Funktion - Kein spezialisierter Browser - Lesbarkeit abhängig von Zoom User & Setup 3 Das Setup der dritten Testperson besteht aus einem grossformatigen TV-Gerät und einer daran angeschlossenen Playstation 3. Die Playstation wird mittels eines originalen PS-Controllers bedient, es kommen keine weiteren HID’s zum Einsatz. Zum Surfen wird ein eigener, in das PS-3-Betriebssystem integrierter Browser verwendet. Auf diesem System wird das Internet für die unterschiedlichsten Zwecke benutzt, sei es für Internet-Recherchen, zur Unterhaltung oder auch einer eher TV-bezogenen Nutzung zum Streamen von Filmen aus dem Web. Der Vorteil dieses Systems liegt darin, dass es sofort Betriebsbereit ist und somit auch eine klare Alternative zu normalen Computern darstellt, wenn es darum geht, schnell mal was im Internet nachzuschauen, ohne dafür extra den Computer aufstarten zu müssen. Des Weiteren besitzt dieses Setup als einziges einen Controller, welcher auf dem Sofa bequem benutzt werden kann. Ein Nachteil ist aber die etwas umständliche Texteingabe. Vorteile: - Fixe Installation - Sofort und spontan einsetzbar - Sofa- fähiger Controller - Angepasster Browser - Angepasste Zoomfunktion Nachteile: - Texteingabe nicht optimal - Cursor langsamer als Maus - Kein Standardbrowser - Nicht die gewohnten Bookmarks 3.0 Kontext-Recherche 3.1 Nutzer-Befragung & Analyse Usability-Diagramme : Schlussfolgerungen Funktionalität vs. Komfort Werden computerbasierte Interfaces wie Maus und Tastatur im Sofa-Kontext benutzt, ist der Komfort umso kleiner, je grösser die eigentliche Funktionalität der Interfaces ist. Bei spezialisierten Interfaces wie z.B. dem PS3-Controller verhält es sich genau umgekehrt. Es muss also nach Lösungen gesucht werden, welche sowohl einen hohen Komfort als auch eine Mindestfunktionalität bei beispielsweise der Benutzung auf einem Sofa bieten. Zooming gewährleistet Lesbarkeit Das Zooming und die Lesbarkeit stehen wohl in unmittelbarem Zusammenhang, da aufgrund des Abstands zum Screen und der Auslegung der meisten Webseiten auf einen Desktop-Kontext die Lesbarkeit im Wohnzimmer- Kontext nicht immer gewährleistet sein wird. Sie kann jedoch mittels gut steuerbaren Zoom-Funktionen im Bedarfsfall sicher einfach optimiert werden. Bookmark-Zugriff optimiert Komfort Der Bookmark-Zugriff scheint von grosser Wichtigkeit zu sein, da die Texteingabe-Funktionalität bei einem Web-Zugriff mittels eines TV’s wahrscheinlich nie so optimal wie bei einem Desktop-Setup sein wird. Ist jedoch ein guter Bookmark-Zugriff gewährleistet, kann wahrscheinlich auf einen Teil der Texteingaben verzichtet werden, oder es reichen Textfragmente, um gewünschte Webseiten aufrufen zu können. Nutzungszweck-Diagramme: Schlussfolgerungen Arbeit im Wohnzimmer scheint unerwünscht zu sein, das Lesen von Mails gehört aber zum Alltag, wieso es also nicht auf dem Sofa erledigen.Auch Web-Recherchen sowie Online-Shopping können laut der Meinung der Testpersonen gut in einen angenehmeren Kontext verlagert werden.Online-Kommunikation mittels Skype oder Chat könnte ebenfalls gut auf dem Sofa stattfinden, hierbei kommt es wohl darauf an, wie öffentlich die Situation und wie privat das Gespräch ist. Dasselbe gilt für die Nutzung von Social-Apps wie z.B. Facebook. Surfen zum Spass macht in einer angenehmeren Umgebung eventuell noch mehr Spass. Der soziale Aspekt scheint eine grosse Rolle zu spielen, Nutzungsarten wie das gemeinsame Ansehen respektive Zeigen von Web-Videos oder generell Webseiten scheinen im Wohnzimmer auf angenehmere Weise praktizierbar zu sein als in arbeitsbezogenen Umgebungen. Die Nutzung von audiovisuellen Medien scheint automatisch mit einem WohnzimmerKontext assoziiert zu werden und kann somit auch mit dem Web als Quelle dort stattfinden, laut Umfrageergebnissen sogar präferiert, wahrscheinlich auch mit dem Hintergrund der gemeinsamen Nutzung. Der Konsum von z.B. gestreamten Filmen entspricht der klassischen Nutzung des TV’s und ist dementsprechend auch in einem Wohnzimmer-Web-Kontext beliebt. 3.1 Usability- & Nutzungszweck-Diagramme Nutzungszweck Organisation Private Nutzung Skype / Chat Word etc. Facebook Mail YouTube Recherche Spassbrowsen Online Games Online einkaufen News Links zeigen Blogs Filme streamen Videos zeigen Partykalender Musik hören 2 Öffentliche Nutz. Musik-Videos 3 4 Arbeit Info 5 6 Sozial Spass 3.0 Kontext-Recherche 3.2 Moodboard Das von mir erstellte Moodboard (Anhang 2) sollte einerseits alle Bereiche aufzeigen, welche Zusammenspielen müssen oder zumindest sollten, wenn Internet und TV kombiniert werden. Andererseits habe ich es auch gleich dazu benutzt, Vor- und Nachteile der einzelnen Bereiche zu identifizieren, welche für das Web auf dem TV übernommen, adaptiert oder vermieden werden sollten. Home Office Vorteile: Ergonomie, schnelle Texteingabe, gute Lesbarkeit von Webinhalten Nachteile: Büro-Atmosphäre, meist Einzelarbeitsplatz, kein sozialer Raum Living Room Vorteile: relaxte Atmosphäre, bequemes Ambiente, sozialer Raum Nachteile: meist nur TV-Content, kein Webzugriff oder schlechte Bedienbarkeit Das Web an sich Vorteile: Bedienbarkeit, ungehinderter Web-Zugriff, Bookmarks Nachteile: für die Maus und Computer optimiert, Arbeits-Atmosphäre Couch-Laptop Vorteile: bequemes Ambiente, Standard-Browser, Bookmarks Nachteile: Bedienbarkeit, unergonomisch, Behelfs-Lösung Living Room Web Vorteile: gemeinsames Erlebnis, relaxte Atmosphäre, direkter Austausch Nachteile: kleines Display, schlechte Sicht, unergonomisch Social TV Vorteile: gemeinsames Erlebnis, bequemes Ambiente, direkter Austausch Nachteile: nur TV-Inhalte, kein Web-Zugriff, Bedienbarkeit eingeschränkt 3.3 Funktionsumfang des Browsers Um feststellen zu können, welche Funktionalität gängige Browser im Originalzustand bieten, also direkt nach der Installation und ohne den Funktionsumfang erweiternde Plugins, habe ich Firefox, Safari und den InternetExplorer daraufhin untersucht. Gleichzeitig habe ich auch festgehalten, wie diese einzelnen Funktionalitäten mit unterschiedlichen Interfaces bedient werden. Des weiteren wurde auch die Funktionen, welche zur Bedienung von TV-Inhalten notwendig sind definiert, da auch TV-Inhalte in den Prototypen integriert werden sollten. Siehe hierzu Tabelle Das Resultat aus diesen Untersuchungen ist erstens eine Liste der Mindestfunktionalität, welche eine Browser erfüllen muss, und zweitens die Erkenntnis, das mittels Gesten wohl viel effektiver mit dem Browser interagiert werden kann als dies über das klassische Browser-GUI möglich ist. Tabelle zu 3.3 3.0 Kontext-Recherche 3.4 Gestik als Inputmethode Der Nutzen von Gesten Infolge der Schlussfolgerungen aus dem vorhergehenden Abschnitt habe ich mich entschlossen, die Steuerung meines Projektes so weit wie möglich über Gesten [4] zu realisieren, da sie einige Vorteile bieten: -Gestik erleichtert und unterstützt die Interaktion -Gestik funktioniert intuitiv und schnell -Simple Gesten sind einfach erlernbar -Gesten können an jedem beliebigen Ort auf dem Screen ausgeführt werden -Maus- respektive Cursor-Bewegungen können minimiert werden -Buttons an sich und somit auch das Klicken auf Buttons entfallen Vor allem die drei letzten Punkte sind wesentliche Argumente, um bei meinem Projekt Gesten zur Interaktion einzusetzen. Gesten können dort gezeichnet werden, wo sich der Cursor gerade befindet, was die Navigation beschleunigt und somit die Bedienung erleichtert. Des weiteren kann auf Buttons verzichtet werden, was wiederum den Weg, welcher bis zu einem Button zurückzulegen ist, einspart, und zudem auch optisch mehr Fläche für den eigentlichen Inhalt übrig lässt und ein GUI im Browser selbst zu grossen Teilen überflüssig macht. Verwendbare Gesten In meinem Projekt sollen v.a. deiktische und ikonische Gesten (siehe auch [4]) zum Einsatz kommen, da sie meist intuitiv benutzbar oder zumindest einfach erlern-, merk- und verknüpfbar sind. Eine Übersicht gängiger deiktischer und ikonischer Gesten, welche im Projekt verwendet werden können, habe ich in der Abbildung nebenan zusammengetragen. Hierbei wurde darauf geachtet, dass die Gesten von gängigen Gesten-ErkennungsAlgorithmen problemlos erkannt werden können. Zudem ist jede Geste in all ihren möglichen Ausführungen (d.h. auf welche Arten sie gezeichnet werden können) aufgeführt. Ausführungsarten von Gesten In wantee werden zwei unterschiedliche Eingabemethoden für die Gesten verwendet. Auf der einen Seite kommen gezeichnete Gesten zum Einsatz, also Gesten, welche auch optisch auf dem Display dargestellt werden. Um sie von normalen Navigationsbewegungen unterscheiden zu können, wird ein sogenannter “Trigger“ verwendet, welcher meist durch die rechte Maustaste, im Falle von wantee aber durch längeres, (0.5 bis 1 sek.) leichtes Drücken des Pen’s auf das Tablet ausgelöst wird. Auf der anderen Seite kommen sogenannte Flicks zum Einsatz. Flicks sind einfache, gerade Gesten ohne Kurven oder Ecken, welche durch eine sehr schnelle, leichte Bewegung des Pens aufgerufen werden. Sie haben keine optische Repräsentation auf dem Display und können die genau gleiche Form und /oder Richtung wie identische gezeichnete Gesten haben. Siehe hierzu auch Punkte die 4.4 & 4.5. Mögliche Gesten 3.0 Kontext-Recherche 3.5 Anforderungs-Katalog für das Interface Nachfolgend habe ich anhand einiger von Ken Hinckley (vgl. Hinckley:161ff) zu InputTechnologie und Input-Techniken aufgestellter Kriterien versucht, einen AnforderungsKatalog für das zu benutzende Interface zu erstellen. Dieser wurder im Verlauf des Projekts immer wieder angepasst und auch mit den Ergebnissen aus den Experimenten und Tests komplettiert. Property sensed /Number of Dimension “Property sensed“ beschreibt, welche Bewegung gemessen wird. Dies kann eine lineare Position, Bewegung oder auch eine Krafteinwirkung sein. Die “Number of dimensions“ beschreibt die Anzahl benötigter Dimensionen. Eine Maus misst beispielsweise Bewegungen in 2 linearen Dimensionen (vgl. Hinckley: 162). Um eine Webseite bedienen zu können reicht eine lineare Bewegungsverfolgung auf 2 Achsen, also einer x- und y-Achse wie bei einer normalen Maus üblich, da es sich bei Webseiten- Content bis anhin immer um 2-dimensionale Inhalte handelt, oder falls eine (simulierte) dritte Dimension vorhanden ist diese dennoch mittels 2-Achsen-Navigation bedient werden kann. Eventuell könnte bei einer Bedienung mit einem Pen auch die Andruckstärke verwendet werden, um gewisse Parameter zu beeinflussen. Indirect vs. Direct (vgl. Hinckley: 161ff) Mit einem indirekten Input ist beispielsweise eine Maus gemeint, da der Nutzer sie bewegen muss, um damit einen Cursor auf einem Bildschirm bewegen zu können. Bei direktem Input besteht dieser Umweg nicht, eine Eingabe kann direkt auf einem Touchscreen vorgenommen werden (vgl. Hinckley: 162). Da der Hauptbildschirm bei diesem Projekt ein TV ist, welcher einige Meter vom Benutzer entfernt steht, sollte meiner Meinung nach unbedingt einer indirekten Bedienung der Vorzug gegeben werden, da der Nutzer hierbei nie den Blick vom Bildschirm abwenden muss. Dies vor allem aus zwei wichtigen Gründen: erstens soll ein ständiges Repositionieren/ Anwinkeln des Kopfes vermieden werden, und zweitens soll auch ein damit einhergehendes, permanentes Neu-Fokussieren minimiert werden. In einer entspannten, zurückgelehnten Position und zudem einige Meter von einem Monitor entfernt, wie dies bei einem Sofa-TV-Setup der Fall ist, kann es sein, dass der Nutzer seinen Kopf wesentlich stärker neigen muss um vom TV z.B. auf ein Interface in seinem Schoss schauen zu können, als dies bei einem Schreibtisch-Setup der Fall ist, wenn der Nutzer aufrecht sitzt und sein Blick zwischen Tastatur und Bildschirm hin und her wandert. Durch die grosse Distanz zwischen TV und einem nahe beim Nutzer plazierten Interface muss bei einem direkten Input zudem stark zwischen nah und fern fokussiert werden, was auf die Dauer ermüdend wirkt. Device acquisition time / Homing time Die “device acquisition time“ beschreibt die nötige Zeit, um die Hand von einer gegebenen Ausgangsposition auf einem Interface zu plazieren, also z.B. von der Tastatur auf die Maus. Die “homing time“ beschreibt die Zeit, welche benötigt wird, um die Hand wieder in die Ausgangsposition zu bringen, als z.B. von der Maus auf die Tastatur (vgl. Hinckley: 162). Idealerweise ist diese Zeit möglichst kurz, was dann erreicht wird, wenn nicht zwischen verschiedenen Interfaces gewechselt werden muss. Relative vs. Absolute Mode Im relativen Modus wird der Cursor unabhängig von der Interfaceposition verschoben, d.h. wenn z.B. die Maus angehoben wird, bleibt der Cursor an seiner momentanen Position stehen. Wird nun die Maus zurückversetzt und weiterbewegt, wird der Cursor nicht zurückversetzt aber trotzdem entsprechend der neuen Bewegung der Maus weiterbewegt. Im absoluten Modus besteht ein fixes C : D -“Gain“ -Verhältnis, die Position des Interfaces korreliert immer direkt mit der Position des Cursors (vgl. Hinckley: 163). Mäuse und Touchpads arbeiten meist im relativen Modus, während Touchscreens gezwungenermassen im absoluten Modus funktionieren, bei Tablets kann der Modus oftmals umgestellt werden. Für mein Projekt erscheint mir ein Interface mit absoluter Positionierung als geeigneter, da hierbei das Interface den Aktionsradius vorgibt und dieser somit nicht beliebig erweitert werden kann wie dies bei einer Maus möglich ist. Zudem entfällt auch das häufige Repositionieren, welches bei einer Maus oder vor allem auch bei einem Touchpad häufig benutzt werden muss, um den Cursor gerade bei einer hohen Auflösung zu positionieren. Gain “Gain“ beschreibt das Verhältnis von “control-to-display“ (C : D), also derjenigen Distanz, welche mit dem Interface zurückgelegt wird im Vergleich zur Distanz, welche mit dem Cursor auf dem Display zurückgelegt wird (vgl. Hinckley: 162). Dieses Verhältnis sollte im Bezug auf ein Interface, welches auch vom Sofa aus bedient werden kann so gewählt werden, dass sowohl die Platzverhältnisse respektive die Grösse des Interfaces, aber auch die Auflösung des TV’s berücksichtigt werden. Das Interface darf also einerseits nicht zu gross sein, denn obwohl die Platzverhältnisse beschränkt sind, soll eine angenehme Bedienung gewährleistet sein. Andererseits darf es aber auch nicht zu klein sein, da ansonsten bei einer Auflösung des TV’s von 1920 x1080 (Full-HD) die Navigation ungenau wird oder das Interface sehr präzise bedient werden muss, was in einer entspannten Haltung eventuell nicht möglich ist. 4.0 Tests & Experimente 4.1 On-Screen-Keyboard Da in meinem Projekt eventuell ein On-Screen-Keyboard zum Einsatz kommen sollte, habe ich als erstes einige Tests hierzu durchgeführt, um ein Gefühl dafür zu bekommen, wie gut dieses ohne Maus zu bedienen ist. Das On-Screen-Keyboard lief im Browser, da dies bei einem Einsatz im definitiven Prototypen auch so sein sollte. Als Eingabemedium zum Einsatz gekommen ist erstens ein Wacom-Tablet, wobei die Eingabe mittels des Pens vorgenommen wurde. Als zweites Input-Device wurde das Trackpad eines Macbook Pro’s verwendet. Die Texteingabe funktioniert so, dass der Mauscursor mittels Pen oder Finger auf der gewünschten Ziffer positioniert und sodann darauf geklickt wird. Mit beiden Interfaces wurde jeweils derselbe Text eingegeben und dieselben Löschaktionen ausgeführt. Es hat sich gezeigt, dass die Eingabe mit beiden Interfaces in etwa gleich schnell und im Allgemeinen auch relativ flüssig vonstatten ging. Ein Vorteil des Pen’s ist seine grössere Präzision, ein Vorteil des Trackpas besteht darin, dass ausser einem Finger zur Texteingabe nichts weiter benötigt wird. Zwar kann Text auf diese Weise niemals so schnell wie mit einer Tastatur eingegeben werden, dennoch funktioniert diese Methode schneller und besser als die Eingabemethoden z.B. der Playstation 3 und der Wiii (siehe hierzu 2.2). In einem weiteren Prototypen habe ich später versucht, die Texteingabe mittels Finger noch zu verfeinern, siehe hierzu auch Punkt 4.4. Ein Video zu diesem Test ist auf dem Projekt-Blog verfügbar (vgl. Web24). 4.2 Keyboard-Trackball-Kombination Stellvertretend für die diversen in der Hintergrundrecherche aufgeführten Kombinationen aus einer Tastatur und einem Mausersatz habe ich ein “Trust Wireless Entertainement Keyboard“ (vgl. Punkt 2.3) erworben und getestet. Das Keyboard ist in etwa so gross wie eine kleinere “normale“ Tastatur und hat nebst einer vollständigen, teilweise miniaturisierten Tastatur mit angepasstem Layout auch einige zusätzliche Medien-Tasten, von welchen zur Steuerung des Internets aber nur die “Home“-Taste verwendet werden kann. Aufgrund ihrer Grösse muss die Tastatur beim Tippen irgendwo (z.B. auf den Oberschenkeln) aufliegen. Dadurch müssen die Handgelenke relativ stark angewinkelt werden, was ich als unangenehm und unergonomisch empfunden habe und mich zudem beim Tippen etwas behindert hat. Das Tastaturlayout wurde etwas “gequetscht“ und angepasst, so ist beispielsweise die Leertaste nur ca. 6cm lang, am rechten Rand wurde eine Reihe Sondertasten wie “PageUp“ oder “End“ angesetzt und unterhalb der “Return“-Taste wurden die Pfeiltasten integriert. Dies macht es auch bei Beherrschung des 10-Finger-Systems etwas schwierig, fliessend auf der Tastatur zu schreiben ohne darauf zu sehen. Links und rechts der Tastatur befinden sich leicht erhöht die zusätzlichen Eingabeelemente, welche mit den Daumen bedient werden können, wenn das Keyboard in den Händen gehalten wird. Auf der linken Seite sind ein Scrollrad (nur vertikales scrollen möglich) sowie einigen Medien-Tasten (Play/Pause, Lautstärke etc.) integriert, auf der rechten Seite befindet sich ein Trackball. Dieser kann eigentlich nur mit dem rechten Zeigefinger oder besser Daumen bedient werden, was das Keyboard für Linkshänder praktisch unbedienbar macht. Um den Cursor präzise steuern zu können muss die Zeigergeschwindigkeit relativ langsam sein, was häufiges Nachgreifen zur Folge hat. Eine Eingabe von Gesten ist nur schwer zu bewerkstelligen. Die Maustasten befinden sich an der Front, auf der linken Seite die linke Maustaste (Primärklick), analog auf der rechten Seite die rechte Maustaste (Sekundärklick), welche mit den Zeigefingern bedient werden. Dies erwies sich als recht ungewohnt, da die Maustasten-Funktionen nun auf einmal auf zwei Hände aufgeteilt sind. Das Spezielle daran ist, dass ich mich als Rechtshänder gewohnt bin, mit dem Zeigefinger der rechten Hand zu klicken, wenn ich einen Link öffnen will. Durch diese Verteilung der Maustasten auf zwei Hände musste ich nun aber auf einmal mit dem linken Zeigefinger klicken, um dasselbe zu erreichen. Um die Maustasten angenehm bedienen zu können muss das Keyboard zudem optimalerweise angehoben werden, was etwas umständlich ist, da es zum Schreiben wie bereits erwähnt aufliegen muss. Bei Betrachtung aller vorhergehend aufgeführten Negativpunkte sowie der unter Punkt 3.5 erstellten Anforderungen hat sich diese Art von Interface als suboptimal erwiesen, der einzige grosse Vorteil liegt in der relativ schnell vonstatten gehenden Texteingabe. Auch andere, in der Hintergrund-Recherche erwähnte kleinere Keyboard-Kombinationen weisen wohl ähnliche Mängel auf. Zwar muss bei diesen das Keyboard nicht unbedingt aufliegen, jedoch kann dann nicht mit 10 Fingern getippt werden, was wiederum die Texteingabe verlangsamt. Des weiteren dürfte bei diesen anderen Interfaces die Maus-Emulation (meist schon Aufgrund der Grösse) ähnlich unpräzise sein. 4.3 Adobe-Air basierter Browser Da ein Browser zu den Kernelementen meines Projektes gehört, habe ich mich frühzeitig nach Möglichkeiten umgesehen, einen fast beliebig anpassbaren Browser zu realisieren. Das Problem hierbei war, dass dieser auch mit einem anderen Interface als einer Maus kontrolliert werden können sollte, zudem sollte auch eine eventuelle Oberfläche den Gegebenheiten eine TV-Screens angepasst werden können, weshalb meine Wahl schliesslich auf Adobe Air und ActionScript als Entwicklungsumgebung fiel. Der Kern des Browsers wurde mit dem HTMLloader der Air 2 Beta SDK implementiert, welcher auf der WebKit-Engine basiert. Dank einiger noch undokumentierter neuer Features und mit viel tüfteln und ausprobieren verbrachter Zeit gelang es mir, den Browser mit den von mir benötigten Funktionen zum Laufen zu bringen. Dieser als Testprototyp erstellte Basis-Code hat schlussendlich auch Eingang in den wanteePrototyp gefunden. 4.0 Tests & Experimente 4.4 Touchpad Für erste Experimente wurde ein “Wacom Bamboo Touch“-Touchpad (vgl. Web20) verwendet, welches das einzige zurzeit auf dem Markt erhältliche Touchpad zu sein scheint, das grösser als ein Standard Laptop-Touchpad ist. Der Treiber des Bamboo Touch emuliert erstens eine Maus im relativen Modus und kann zweitens mehrere nachfolgend aufgelistete simple Gesten erkennen, welche jedoch nicht verändert werden können. Mehr als 2 Finger können vom Bamboo Touch nicht erkannt werden, und eine Benutzung im absoluten Modus ist nicht vorgesehen. -Ein-Finger Bewegung (emuliert Mauscursor) -Ein-Finger-Tip (emuliert Klick) -Ein-Finger Doppel-Tip ( emuliert Doppelklick) -Zwei-Finger-Tip ( emuliert rechte Maustaste für Kontextmenü) -Zwei-Finger Scrollen vertikal -Zwei-Finger Scrollen horizontal -Zwei-Finger-Flick nach links (emuliert Zurück-Funktion) -Zwei-Finger-Flick nach rechts (emuliert Vorwärts-Funktion) -Zwei-Finger-Pinch von innen nach aussen (emuliert Einzoomen) -Zwei-Finger Pinch von aussen nach innen (emuliert Auszoomen) -Zwei-Finger Rotation Diese vorhandenen Gesten reichen zur Steuerung meiner Anwendung aber nicht aus, (siehe hierzu auch Punkt 3.3), zudem können auch durch das Bewegen von zwei Finger gleichzeitig keine weiteren Gesten erkannt und gezeichnet werden, da der Treiber die Mausfunktionalität blockiert, sobald zwei Finger auf dem Pad aufliegen. Ich habe deshalb nach einer Möglichkeit gesucht, die X- und Y-Positionen der einzelnen Finger direkt abzugreifen, ohne dass eine Maus emuliert und so der Cursor bewegt wird. Dies ist mir dank eines Bamboo-to-TUIO-Treibers (vgl. Web21) gelungen [1]. Der TUIO-Treiber sendet die X- und Y-Koordinaten der Finger an FLOSC. FLOSC (FlashOpenSoundControl, vgl. Web 22) ist ein Java-Server, welcher die empfangenen Daten nach OSC [2] portiert und sie über den TCP-Port zur Verfügung stellt. FLOSC stellt somit die Verbindung zwischen Flash (in welchem dieser Prototyp programmiert wurde) her, die von FLOSC bereitgestellten Daten können in Flash mittels eines NetSockets verarbeitet werden. Die vom Bamboo-TUIO-Treiber gelieferten Werte entsprechen der absoluten Position der Finger auf dem Touchpad, die Bewegungen können somit 1:1 auf die Applikationsoberfläche übertragen und aufgrund ihrer X- und Y-Position auf Touchevents oder Gesten hin analysiert werden. Gestik-Erkennung Die Gestik-Erkennung geschieht in diesem Prototyp aufgrund der Analyse von Mausoder Fingerbewegung. Für gezeichnete Gesten wird ein Trigger benötigt, welcher die Gesten-Erkennung startet, damit zwischen normalem Navigieren und der Eingabe einer Geste unterschieden werden kann. Als Trigger dient in diesem Falle die rechte Maustaste (welche anstatt eines Kontextmenüs die Gestik-Erkennung aktiviert) oder ein zweiter Finger (respektive ein zweiter Touchpoint). Die von mir in den Prototypen verwendete Methode basiert auf der Zerlegbarkeit der Gesten in einzelne Richtungen, welche eine Zahlenfolge ergeben (vgl. auch Web23 ). Vordefinierte Geste werden auf ihren Aufbau hin analysiert und in möglichst prägnante, einzelne Schritte unterteilt, welche nötig sind, um sie zu zeichnen. Diesen einzelnen Schritten werden danach jeweils eine von 8 charakteristischen Richtungen zugewiesen, wobei jede dieser 8 Richtungen für eine Zahl zwischen 0 und 7 steht. Anhand diese Richtungs- oder Bewegungsablaufs wird sodann eine Zahlenfolge generiert, welche für diese Geste steht. Wird nun die Gesten-Erkennung aktiviert, wird jede nachfolgende Bewegung wiederum einer dieser 8 Richtungen zugeordnet. Welche Richtungen oder respektive welche daraus resultierende Zahlenkombination am wahrscheinlichsten ist, wird mittels der Levenshtein-Distanz-Formel [3] berechnet. Die durch die Gesten-Erkennung generierte Zahlenfolge wird nun mit allen Zahlenfolgen der gespeicherten Gesten verglichen und im Falle einer Übereinstimmung die der Geste zugeordnete Aktion ausgelöst. Für die Erkennung von Flicks ist kein eigentlicher Trigger nötig, die Cursorbewegung muss deshalb ständig mitverfolgt und in diesem Fall auf starke, kurzzeitige Beschleunigung in eine bestimmte Richtung überwacht werden. Aus diesem Grund bestehen Flicks auch nur aus einfachen, strichförmigen Gesten ohne Kurven oder Ecken (siehe hierzu auch Punkt 3.4). Im grossen und ganzen hat diese Technik zur Gesten-Erkennung funktioniert, sie liess aber an Präzision zu wünschen übrig. Die Erkennung von Flicks hat leider nie wirklich funktioniert, wobei ich auch nicht eruieren konnte, ob der Fehler in meinem Code oder allgemein an der Event-Verarbeitung von Flash gelegen hat, oder ob sie schlicht aus Performance-Gründen nicht zum Laufen zu bringen war, da ein ständiges Überwachen der Fingerkoordinaten einiges an Rechenleistung erfordert. 4.0 Tests & Experimente 4.4 Touchpad Schlussendlich hat aber ein anderes, relativ banales Problem dieses Setup zum Scheitern verurteilt: der von mir in Flash erstellte Browser konnte die TUIO-Touchevents nicht als Klicks interpretieren, das heisst, es konnte nicht mit dem Finger auf ein Link geklickt werden. Da weder Flash noch Air aus sich heraus native System-Clicks generieren können, hätten die TUIO-Daten zu Maus-Daten emuliert werden müssen, was dann aber wiederum bedeutet hätte, dass nur noch ein Koordinatenpaar zur Verfügung steht und nicht mehr zwei, und somit auch die Gestik-Erkennung nicht mehr funktioniert. Textinput Ein Textinput mittels Finger war somit nicht mehr allzu schwer zu realisieren, es musste lediglich ein On-Screen-Keyboard erstellt werden, welches auf Touchevents reagiert. Im Gegensatz zum ersten Test mit On-Screen-Keyboards (siehe hierzu Punkt 4.1) sollte nun aber nicht mehr zuerst der Cursor auf eine Ziffer bewegt und dann geklickt werden müssen, sondern die entsprechende Ziffer sollte direkt angetippt werden können. Auch dies war dank absoluter Positionsdaten der Touchevents leicht zu bewerkstelligen. Aufgrund des TUIO Trackings ist aber kein eigentlicher Mauszeiger mehr vorhanden, der Finger erzeugt auf dem Bildschirm nur dann eine optische Repräsentation, wenn auf das Touchpad gedrückt wird. Um direkt Text eingeben zu können muss also quasi ins leere getippt werden, was sich als relativ schwierig und auch nicht gerade benutzerfreundlich erwiesen hat. Testweise habe ich deshalb eine Tastatur auf das Touchpad “gezeichnet“, worauf die Texteingabe relativ gut funktioniert hat, so konnte auch mit zwei Fingern abwechselnd getippt werden. Der Nachteil bestand aber darin, dass nun zum Tippen (zumindest während einer Eingewöhnungsphase) auf das Touchpad geschaut werden musste, was eigentlich den unter Punkt 3.5 Anforderungen definierten Anforderungen an das Interface widersprach. 4.5 Pen & Tablet, Handschriften-Erkennung Nachdem die Tests mit dem Touchpad nicht besonders erfolgreich verlaufen sind, war der Gedanke naheliegend, anstatt der Finger einen Pen und ein Tablet als Interface zu testen, da dies technisch gesehen viel näher an einer Maus und deshalb unproblematischer zu handhaben und einzubinden ist. Hierzu wurde ein Wacom Bamboo Pen & Touch (vgl. Web25) verwendet. Die Stifteingabe funktionierte problemlos, auch die Rate der erkannten Gesten konnte dank des präziseren Inputs gesteigert werden, war jedoch immer noch nicht völlig befriedigend. Deshalb habe ich zu diesem Zeitpunkt auch beschlossen, zur GestikErkennung eine externe Software zu verwenden, welche direkt im System und nicht in Flash läuft, was vor allem den Prozessor entlastet und generell dank nativem Zugriff auf die Cursorbewegung besser funktioniert. Da nun schon ein Stift im Spiel war konnte mit diesem auch der Textinput per Handschriftenerkennung erfolgen. Weil schon die Gestik-Erkennung in Flash nicht besonders gut funktioniert hat, bestand keine Aussicht darauf, eine HandschriftenErkennung in Flash implementieren zu können. Deshalb habe ich zwei unterschiedliche Programme dazu getestet. Einerseits die in Windows 7 integrierte HandschriftenErkennung (in den Tablet-Funktionen zu finden), andererseits MyScript Stylus von Visionobjects (vgl. Web26), eine Standalone-Software. Die Erkennung der Handschrift funktionierte in beiden Programmen auf Anhieb überraschend gut, die Textbearbeitungs-Funktionalitäten sind in etwa dieselben. Nach längerem austesten hat sich dann schlussendlich jedoch Windows 7 als sinnvoller erwiesen, da es insgesamt besser in den Prototypen integriert werden konnte. 5.0 Das wantee-Konzept Die Konzept-Idee hinter wantee kann eigentlich in einem Satz zusammengefasst werden: wantee soll Web & TV vereinen, mittels Gesten steuerbar sein und ein komfortables gemeinsames Erlebnis unterschiedlichster Medieninhalte in angenehmer Umgebung ermöglichen. Mit diesem Ziel vor Augen und allen vorher erwähnten Recherchen, Test und Experimenten im Hinterkopf habe ich versucht, ein stringentes Konzept zu entwickeln, auf welches nun nachfolgend eingegangen werden soll. 5.1 Wahl des Interfaces Nach den diversen Tests (Punkt 4) und auch der Evaluation der Anforderungen an das Interface (Punkt 3.5) haben sich der Pen und das Tablet als klar beste Variante erwiesen, was auch durch die Vergleichstabelle ersichtlich wird. Wert / I nterfa ce Maus Key- kombi Touchscreen Property /D imensions x, y, 2 x, y, 2 x, y, 2 Indirect / D irect Touchpad Pen & Tablet x, y, 2 x, y, 3 indirekt 1 indirekt 1 indirekt 1 direkt 0 indirekt 1 Aquisition / H oming mitt el 1 hoch 0 gering 2 mitt el 1 gering 2 Relative / A bsolute relativ 0 relativ 0 absolut 1 relativ 0 absolut 1 Gain gross 0 gross 0 mitt el 1 mitt el 1 gering 2 Präzision gross 1 gering 0 mitt el 1 mitt el 1 gross 2 ja 1 nein 0 ja 1 ja 1 ja 1 mitt el 1 gross 2 mitt el 1 mitt el 1 mitt el 1 gut 2 sch lecht 0 mitt el 1 mitt el 1 gut 2 7 3 8 7 Linkshänder-tauglich Text -Input-Speed Gest ik-Tauglich Punkt e 12 Eine Bedienung mittels Pen & Tablet bringt zudem weitere Vorteile. Die Texteingabe funktioniert analog dem Schreiben auf Papier, womit sich wohl die meisten Leute auskennen, und funktioniert im Vergleich zu den anderen getesteten Interfaces mindestens gleich gut und schnell, wenn nicht sogar besser. Auch Gesten können mit dem Pen effektiv von Hand gezeichnet werden. Die aktive Fläche des Tablets hat ein Format im Verhältnis von 16:9, was auch dem Format eines HD-TV’s entspricht, in Verbindung mit dem absoluten Modus in welchem das Tablet betrieben wird kann so intuitiv richtig navigiert werden. Als schöner Nebeneffekt generiert ein Tip (Klick) mit dem Pen auch ein feines haptisches Feedback. 5.2 Zuordnung der Gesten & Funktionen Die möglichen Funktionen wurden aufgrund der unter Punkt 3.3 getätigten Überlegungen festgelegt. Die Gesten zu den einzelnen Funktionen wurden auf Grund der unter Punkt 3.4 getätigten Überlegungen festgelegt und so ausgewählt, dass sie ikonisch und deiktisch am besten zu den jeweiligen Funktionen passen. Alle Funktionen und die dazugehörigen Gesten sind in Abbildung Gesten zu finden. Abbildung Zuordnung der Gesten & Funktionen Browser -Funktionen TV -Funktionen Link klicken Kanalwahl URL eingeben Vorheriger Sender Back Nàchster Sender Forward Volume Up Bookmarks Volume down Home Bookmarks Neuer Bookmark Home Refresh Neuer Bookmark Stop Main App-Zoom Link in neuem Tab toggle Info Text kopieren URL eingeben Scrollen nach oben Scrollen nach unten Scrollen nach links Scrollen nach rechts Seitenanfang Seitenanfang rechts Seitenende Seitenende rechts Einzoomen (CSS Zoom) Auszoomen (CSS Zoom) Fix-Zoom toggle Main App-Zoom toggle Info 5.0 Das wantee-Konzept 5.3 Bedienung von wantee mittels Pen & Tablet Im Folgenden soll kurz die Bedienung von wantee mittels Pen & Tablet erläutert werden. Siehe hierzu auch Anhang 3: Kurzanleitung. Bewegen des Cursors: Um den Cursor zu bewegen wird der Pen circa 3 -5 mm oberhalb des Tablets bewegt, der Stift soll das Tablet nicht berühren Klicken: Ein Klick wird durch einmaliges kurzes Antippen des Tablets mit dem Stift ausgeführt. Nachfolgend wird ein Klick deshalb als Tip bezeichnet. Doppelklicken: Ein Doppelklick wird durch zweimaliges, kurz aufeinanderfolgendes Tippen auf das Tablet ausgeführt. Nachfolgend wird ein Doppelklick deshalb als Doppel-Tip bezeichnet. Draggen: Um den Inhalt einer Webseite zu draggen wird der Pen an der gewünschten Position leicht auf das Tablet gepresst und sogleich auch die vordere, respektive untere Taste auf dem Pen betätigt. Solange der Pen nicht angehoben wird kann nun der Inhalt gedraggt werden. Zeichnen einer Geste: Um eine Geste zu zeichnen wird der Pen leicht auf das Tablet gepresst und dann kurz in dieser Position belassen. Nach etwa einer Sekunde erscheint ein Ring um den Cursor welcher anzeigt, dass nun eine Geste gezeichnet werden kann. Sodann kann der Stift ohne ihn anzuheben auf dem Tablet bewegt und die Geste gezeichnet werden. Ist das Zeichnen der Geste beendet, wird der Stift wieder vom Tablet abgehoben, die der Geste entsprechende Aktion wird ausgeführt insofern sie erkannt wurde. Ausführen eine Flicks: Um einen Flick auszuführen wird der Pen schnell und mit einer nur ganz sanften Berührung in der gewünschten Richtung über das Tablet gezogen. Flicks werden am besten aus dem Handgelenk heraus ausgeführt, die Bewegung gleicht ungefähr dem flüchtigen Unterstreichen eines Wortes mit einem Stift auf Papier. Fortgeschrittenes Zeichnen einer Geste: Fortgeschrittenen Nutzern steht auch eine zweite Variante zur Verfügung: Solange die hintere respektive obere Taste auf dem Pen gedrückt wird kann eine Geste direkt gezeichnet werden, ohne dass der Pen das Tablet berühren muss. Dies funktioniert analog zum Bewegen des Cursors, so kann auch eine Geste schnell gezeichnet werden. 5.4 Bedienung von wantee mittels Toucheingabe wantee kann teilweise auch mittels Touch-Eingabe bedient werden, um die Benutzung zu vereinfachen. Generell können mit den Fingern der Cursor gesteuert, gescrollt oder simple Gesten benutzt werden. Da in dieser Arbeit der Hauptfokus aber auf der Kontrolle von wantee durch Pen & Tablet liegt, wird nicht näher darauf eingegangen. Welche Funktionen durch Toucheingabe gesteuert werden können wird in den Abschnitten zu den einzelnen Modulen erklärt. 5.5 Areas Die Grundstruktur von wantee und somit auch die oberste Menü-Hierarchie besteht aus 9 gleichwertigen Areas (Abb. siehe Anhang 4), wovon eine auf einmal aktiv (d.h. bildschirmfüllend im Vordergrund) sein kann. In jeder Area kann ein Modul auf einmal aktiv sein, wobei es keine Rolle spielt, ob es sich dabei um ein Web-, Bookmarks- oder TV-Modul handelt. Es können so also beispielsweise 9 Webmodule gleichzeitig geöffnet werden, oder es kann eine beliebige Mischung erstellt werden: in 4 Areas können 4 Web-Module mit vier unterschiedlichen Webseiten geladen sein, in 4 weiteren Areas werden in 4 TV-Modulen vier verschiedene TV-Sender angezeigt, und in der verbleibenden neunten Area ist gerade ein Bookmarks-Modul aktiviert. Um zwischen einzelnen Areas wechseln zu können, wird die Area-Überblicksansicht aufgerufen. Dies geschieht mittels der “A“-Geste, welche immer benutzt werden kann, egal, welche Area oder welches Modul gerade aktiv ist. Die momentan aktive Area wird sodann ausgezoomt, bis alle 9 Areas in der Überblicksansicht (also in ausgezoomtem Zustand) nebeneinander in der eigentlichen Applikation schweben. Jede ausgezoomte Area stellt weiterhin ihren momentanen Inhalt dar, so dass der Nutzer sehen kann, welche Area mit welchem Inhalt er als nächstes aktivieren möchte. Eine Area wird mittels eines Tip’s auf die ausgezoomte Area aktiviert, was bedeutet, dass die angewählte Area einzoomt, bis sie den Screen wieder vollständig füllt. 5.6 Hauptmodule Web-Modul Das Web-Modul (Abb. siehe Anhang 4) ist eigentlich der Hauptbestandteil von wantee, da hiermit der Zugriff auf das Internet und auch die Navigation im Web bewerkstelligt wird. In einem Web-Modul (und somit auch in einer Area) kann eine Website auf einmal geöffnet werden, Tabs oder ähnliches existieren nicht, weitere Webseiten können in anderen Areas geöffnet werden. Das Web-Modul kommt völlig ohne GUI aus, da sämtliche Aktionen im Browser mittels Gesten kontrolliert werden. Als einziges grafisches Element wird während des Ladens einer Seite eine Ladeanzeige überblendet. Ansonsten wird die geladene Webseite bildschirmfüllend angezeigt. 5.0 Das wantee-Konzept 5.6 Hauptmodule Ein Link auf der Webseite wird mittels eines Tip’s darauf aktiviert, die aufgerufene Seite wird im selben Web-Modul geöffnet, auch wenn der Link in HTML per target=“_blank“ eine neue Seite erzwingt. Dies aus dem Grund, dass es nur dem Nutzer erlaubt ist, Areas zu wechseln, damit er die volle Kontrolle behält. Will der Nutzer einen Link in einer anderen Area öffnen, so kann er den Link mittels Pen drücken (nicht tippen) und zu draggen beginnen. Es erscheint ein Hilfslayer, in welchem eine kleine Übersicht aller Areas (ähnlich der Area-Überblicksansicht) angezeigt wird. Der gedraggte Link kann nun auf die gewünschte symbolisch dargestellte Area gezogen werden. Wird der Link in der linken Hälfte der symbolische Area plaziert springt man sofort zur entsprechenden Area, in welcher der gedraggte Link ein einem Web-Modul geladen wird. Wird der Link in der rechten Hälfte der symbolischen Area plaziert bleibt man in der aktiven Area, der Link wird im Hintergrund in der gewählten Area geladen, zu welcher man zu einem späteren Zeitpunkt wechseln kann. Bookmarks-Modul Das Bookmarks-Modul (Abb. siehe Anhang 4) bietet, wie der Name schon sagt, Zugriff auf alle Bookmarks, wobei Bookmarks klassisch Links, aber auch Verknüpfungen zu TV-Kanälen, Widgets, Web-Services etc. sein können. Es ist in zwei Spalten aufgeteilt: in der linken Spalte befinden sich anwählbare Tags und Ordner, welche mittels eines Tip’s die entsprechenden Bookmarks in der rechten Spalte laden. Der Inhalt beider Spalten kann mittels Flicks gescrollt werden. Alle Bookmarks enthalten zur besseren visuellen Identifizierung einen Screenshot respektive ein Logo oder Icon ihres Ziels. Um einen Bookmark aufzurufen muss er lediglich angetippt werden, das entsprechende Modul öffnet sich automatisch. TV-Modul Im TV-Modul (Abb. siehe Anhang 4) können sämtliche TV-Kanäle oder auch OnlineFilm-Dienste, DVD’s etc. angezeigt werden. Durch einen Tip auf den Inhalt wird das Kanal-Hilfsmodul überblendet, in welchem Bookmarks mit Verknüpfungen zu TV-affinen Inhalten wie z.B. TV-Sendern angezeigt werden. Mittels eines Tip’s auf einen Bookmark wird der entsprechende Kanal geladen, wird einfach ins Leere getippt verschwindet das Kanal-Hilfsmodul wieder. Die Kanäle können mittels Flicks vor- und zurück-gezapped werden, auch die Lautstärke wird mittels vertikalen Flicks kontrolliert. Im TV-Modul ist zusätzlich auch eine Kontrolle per Toucheingabe möglich, da es etwas umständlich ist, den Pen in die Hand nehmen zu müssen, nur um den Kanal umzuschalten oder die Lautstärke zu verändern. Das Kanal-Hilfsmodul kann durch tippen mit den Fingern aktiviert und desaktiviert werden. Die Kanäle können mittels Touch-Flicks vor- und zurück-gezapped werden, die Lautstärke wird mittels vertikalem Scrollen kontrolliert. 5.7 Hilfsmodule Hilfsmodule werden bei Aufruf oder kontextabhängig über das jeweils aktive Modul überblendet. URL-Hilfsmodul Das URL-Hilfsmodul (Abb. siehe Anhang 4) erlaubt die Eingabe und Bearbeitung einer URL und kann zudem als Suchbegriffseingabe verwendet werden. Um eine URL einzugeben wird direkt mit dem Pen per Handschrift in das URL-Feld geschrieben, erkannte Ziffern werden in der Systemschrift dargestellt. Um falsch geschriebene Ziffern zu korrigieren können diese einfach überschrieben werden. Um Ziffern oder ganze Wörter zu löschen werden diese von rechts nach links durchgestrichen, alternativ kann hierzu auch der Radierer am oberen Stiftende eingesetzt werden. Um eine zusätzliche Ziffer einzufügen wird an der entsprechenden Stelle von oben nach unten ein Trennstrich gezeichnet. Um ein Leerzeichen zwischen zwei Ziffern oder Wörtern zu entfernen können diese mit einem Bogen verbunden werden. Alternativ können auch die am oberen Rand positionierten Buttons zur URL- respektive Textbearbeitung eingesetzt werden, da sie z.B. in URL’s häufig vorkommende Zeichenketten wie “www.“ oder “.com“ direkt einfügen. Wird anstatt einer gültigen URL einfach ein Begriff eingegeben, startet automatisch eine Websuche mit der in den Einstellungen angegebenen Suchmaschine. Direkt oberhalb des Eingabefeldes wird jeweils (falls vorhanden) die URL der aktuellen Website angezeigt. Diese kann einfach über einen Tip darauf in das Eingabefeld übernommen und gegebenenfalls bearbeitet werden.Direkt unterhalb des Eingabefeldes werden 6 dem momentan eingegebenen Text entsprechende KomplementierungsVorschläge angezeigt, welche URL’s aus dem Verlauf, Bookmarks, früheren Suchbegriffen etc. generiert werden. Um sie zu übernehmen reicht ein Tip auf den gewünschten Vorschlag. Drag-Hilfsmodul Erlaubt das Draggen eines Links auf eine bestimmte Area. Je nachdem ob das Ziel auf die linke Seite der symbolisierten Area oder auf die rechte gezogen wird, öffnet sich automatisch die entsprechende Area oder das Ziel wird im Hintergrund geladen. Such-Hilfsmodul Das Such-Hilfsmodul wird identisch wie das URL-Hilfmodul bedient, enthält aber keine URL-spezifischen Buttons und ist eher für eine Suche innerhalb der Bookmarks gedacht. Es kann aber auch generell zur Eingabe eines Suchbegriffs verwendet werden, es startet automatisch eine Websuche mit der in den Einstellungen angegebenen Suchmaschine. 6.0 Der wantee-Prototyp Der Prototyp von wantee wurde aufgrund der Überlegungen unter Punkt 4.3 komplett mittels Adobe Air respektive Flash und ActionScript realisiert. Analog zum Konzept ist auch der Prototyp modular aufgebaut, alle Module wurden mehr oder weniger separat erstellt und in der eigentlichen wantee-Applikation zusammengefügt. Die Gesten-Erkennung wurde mittels StrokeIt(Web27) realisiert, welches die erkannten Gesten mittels Tastatur-Code ausgibt, die sodann in Flash abgefragt und verarbeitet werden. Der Textinput respektive die Handschriften-Erkennung wird von Windows7 übernommen. Der Prototyp enthält in der ersten Version, mit welcher auch die Evaluation durchgeführt wurde, folgende Features: -funktionsfähiges Web-Modul -funktionsfähiges URL-Modul -funktionsfähiges Bookmarks-Modul -mittels Gesten steuerbar, allerdings ohne Flicks, die Gesten wurden deshalb im Gegensatz zum Konzept angepasst (Siehe hierzu Gesten Proto1) -Gesten können nur durch drücken der oberen Pen-Taste ausgeführt werden, der Pen sollte das Tablet nicht berühren. -Die Touchfunktionalität konnte nicht in den Prototypen integriert werden 7.0 Evaluation 7.1 Testpersonen Der Prototyp wurde in verschiedenen Stadien mit unterschiedlichen Personen getestet, weshalb die Evaluation nicht völlig konsistent ist. Eine Person nutzt das Internet nur sporadisch, die meisten anderen Personen waren sich die Benutzung des Internets gewohnt, können aber nicht alle als Pro-User angesehen werden. Die meisten der Testpersonen haben noch nie mit einem Stift-Tablet gearbeitet. 7.2 Pen & Tablet Handling Wie sich gezeigt hat, bedingt die Bedienung eines Stift-Tablets eine gewisse Einarbeitungszeit. Wichtig ist hier vor allem, dass Personen, welche erstmals ein Stift-Tablet benutzen darauf hingewiesen werden, dass der Stift nicht ständig das Tablet berühren muss, sondern normalerweise 3-5mm oberhalb des Tablets bewegt wird und nur zum Ausführen eines Klicks auf das Tablet gedrückt werden muss. Nach einer Zeit von ca. 2-10min hatten sich aber bereits alle Testpersonen an die Handhabung gewöhnt. Absolute Positionierung Dem Grossteil der Testpersonen ist gar nicht aufgefallen, dass die Positionierung der Mauspfeils im absoluten Modus stattfindet, d.h. die Position des Stiftes auf der TabletFläche entspricht 1:1 der Position des Mauszeiger auf dem Screen. Auf die absolute Positionierung angesprochen haben diese die meisten Personen als intuitiv und angenehm empfunden, v.a. da das oftmalige Nachziehen/ Repositionieren wie es bei einer Maus häufig vorkommt entfällt. Die Tablet-Grösse respektive der darauf zurückzulegende Weg in Korrelation zu einer Screen-Auflösung von 1920x1080 scheint vernünftig zu sein. Es müssen weder allzu grosse Bewegungen mit der Hand ausgeführt werden noch leidet die Präzision der Mauszeigerpositionierung. Pen-Tasten Auch an die Benutzung der Pen-Tasten mussten sich die Testpersonen kurz gewöhnen, was aber auch innerhalb von 2-10min bis zu einem benutzbaren Grad möglich war. Wichtig ist, dass der Benutzer den Stift in einer für ihn angenehmen Position hält und evt. auch darauf hingewiesen wird, dass die Pen-Tasten sowohl mit dem Zeigefinger als auch mit dem Daumen bedient werden kann. 7.0 Evaluation 7.3 Gesten Den meisten Nutzern war eine solche Gestensteuerung bisher unbekannt, sie stiess jedoch meist auf Anklang, sobald erste Erfolge erzielt wurden. Der Vorteil von Gesten, die Bedienung des Browsers schneller vonstatten gehen zu lassen, wurde von allen Testpersonen erkannt. Es hat sich jedoch auch hier gezeigt, dass die Gestensteuerung eine gewisse Einarbeitungszeit respektive Lernphase benötigt, welche in diesem Fall sehr unterschiedlich waren. Einerseits müssen die Gesten zuerst gelernt oder verstanden werden, auch die Logik hinter ähnlichen Gesten muss zuerst durchschaut werden, was aber im Normalfall relativ schnell gelang. Andererseits muss auch die Ausführung der Gesten, also wie und auch wie präzise sie gezeichnet werden müssen zuerst erprobt werden, was von Testperson zu Testperson zu sehr unterschiedlichen Ergebnissen geführt hat. Die meisten Testpersonen haben sich gewünscht, dass die Gesten effektiv auf dem Tablet gezeichnet werden können, was im finalen Prototyp auch realisiert werden konnte. Gesten, welche Richtungen zeigen und auch richtungsorientierte Aktionen auslösen wurden am schnellsten verstanden (z.B. Geste “Oben” = nach oben Scrollen). Gesten, welche Buchstaben imitieren, wurden besser verstanden, wenn auch die dem Buchstaben zugrunde liegende Aktion mit dem Buchstaben an sich und auch der Benennung der Aktion erkannt wurde (z.B. u-Geste um die URL-Eingabe aufzurufen). Zudem kam mehrmals der Wunsch nach einer optischen Hilfe auf, welche zu Beginn einer Geste eingeblendet wird und sodann die möglichen Gesten aufzeigt. 7.4 Texteingabe mittels Pen Die Texteingabe mittels Pen war wie auch die Benutzung eines Pens an sich für die meisten Testpersonen Neuland, scheint aber im Grossen und Ganzen akzeptiert zu werden, auch wenn Anfangs einige Nerven nötig zu sein scheinen. Da im Prototyp die Tablet-Eingabe-Funktion von Windows verwendet wird, habe ich keinen grossen Einfluss auf die hierbei bestehenden Möglichkeiten. Es hat sich jedoch gezeigt, dass für Anfänger der Ziffern- Modus, in welchem jede Ziffer einzeln in ein abgegrenztes Feld geschrieben wird, am besten zu funktionieren scheint. Für die fliessende Texteingabe müssen zuerst die Macken des Systems erkannt und bestenfalls auch ein personalisiertes Handschriften-Erkennungs-Training absolviert werden. 7.5 Buttons Tests zur minimalen noch klickbaren Fläche haben ergeben, dass sogar TabletAnfänger dank der grossen Präzision des Pens sogar noch sehr kleine Buttons von nur 10x10 Pixel relativ genau treffen können. Um die Bedienung zu erleichtern sollten klickbare Flächen aber nach der Ansicht der Testpersonen mindesten ca. 30x30 Pixel gross sein, wobei ich diese aber schlussendlich wesentlich grösser gestaltet habe, um sie Nutzerfreundlicher zu machen. 7.6 Schriftgrösse Die Tests zur gut lesbaren Schriftgrösse haben ergeben, dass die meisten Testpersonen Text bereits ab einer Grösse von 18pt lesen können, was aber je nach Schrift ein bisschen unterschiedlich war. Die Lesbarkeit von Lauftext wurde nicht eruiert, da Lauftext wohl nur als Inhalt von Webseiten vorkommen wird, bei welchem die Schriftart nicht manipuliert werden kann (durch Webseite an sich vorgegeben). Die Schriftgrösse von Lauftext in Webseiten kann durch den Benutzer mittels CSS-Zoom selbst festgelegt werden. Schrift: Veto Com, Regular - knapp lesbar ab 18pt - gut lesbar bei 24-26 pt - optimale Schriftgrösse 22-28pt Schrift: infoOTText, Regular - knapp lesbar ab 20pt - gut lesbar bei 26 pt - optimale Schriftgrösse 24-30pt Schrift: Titilium Maps, Regular - knapp lesbar ab 18pt - gut lesbar bei 24pt - optimale Schriftgrösse 22-28pt 8.0 Finaler wantee-Prototyp Anpassungen aufgrund der Evaluation: -die Standard-Schriftgrösse wurde auf 26pt festgelegt -die Button-Mindestgrösse wurde auf 90x90px korrigiert -Gesten können nun effektiv auf dem Tablet gezeichnet werden, es muss keine Taste gedrückt und auch der Pen nicht oberhalb des Tablets bewegt werden Des Weiteren wurde im finalen Prototyp zusätzlich noch das TV-Modul implementiert, zudem können nun Flicks und somit auch diejenigen Gesten, welche im Konzept beschrieben sind, verwendet werden. Nicht zuletzt wurden auch noch viele Bugfixes vorgenommen. 9.0 Fazit Obwohl ich während des ganzen Projekts immer wieder vor allem mit technischen Schwierigkeiten zu kämpfen hatte, bin ich schlussendlich mit dem Endresultat zufrieden. Dies vor allem deshalb, da ich von Leuten welche den wantee-Prototypen ausprobiert haben grösstenteils positives Feedback erhalten habe. Die meisten Testpersonen konnten den Prototypen nach ein wenig Einarbeitungszeit bedienen. Klar ist jedoch, dass eine sofortige intuitive Bedienung nicht möglich ist, ohne das Tablet und den Pen als Eingabegerät zu beherrschen und die minimal notwendigen Gesten verstanden zu haben, was jedoch meist erstaunlich schnell ging. Auch hat sich allen Testpersonen die Funktionalität des Prototyps relativ schnell erschlossen. Bis auf wenige könnten sich alle vorstellen, eine solche Anwendung im gedachten Kontext (also z.B. auf einem TV im Wohnzimmer) zu benutzen und auch mittels eines Pen’s zu bedienen. 10.0 Anmerkungen [1] TUIO ist ein Community-Standard für die Entwicklung von tangiblen User Interfaces, auf der TUIO-Online-Platform werden verschiedene Programme und Code angeboten, welche das Arbeiten mit Touch-Interfaces und ähnlichem erleichtern. Siehe auch: http://www.tuio.org/ [2] OSC, Open SoundControl, ist ein Protokoll für die Kommunikation zwischen Computern, Synthesizern und weiteren Multimedia-Geräten über das Netzwerk. Siehe auch: http://opensoundcontrol.org [3] Die Levenshtein-Distanz zwischen zwei Zeichenketten ist die minimale Anzahl von Einfüge-, Lösch- und Ersetz-Operationen um die erste Zeichenkette in die zweite umzuwandeln. Benannt ist die Distanz nach dem russischen Wissenschaftler Wladimir Lewenstein, der sie 1965 einführte. Siehe auch : http://de.wikipedia.org/wiki/Levenshtein-Distanz [4] Der Begriff Gestik bezeichnet die Gesamtheit aller Gesten, wobei unter einer Geste hauptsächlich nonverbale Kommunikation verstanden wird. Im alltäglichen Gebrauch werden vor allem Arme und Hände zum Gestikulieren verwendet. Gestik kann sprachersetzend oder auch sprachbegleitend eingesetzt werden, hierbei werden Gesten oft auch unbewusst benutzt. Es können verschiedene Arten von Gestiken unterschieden werden: Lexikalische Gesten Lexikalische Gesten sind erlernte Gesten, wie z.B. das Winken mit der Hand als Zeichen der Begrüssung, sie funktionieren wie Wörter einer Lautsprache (vgl. Königs:3). Koverbale Gesten Koverbale Gesten sind die sprachbegleitenden Gesten, welche oftmals die Aussagen eines Redners unterstreichen und die Vermittlung von Emotionen verstärken (vgl. Königs:3). Ikonische Gesten Ikonische Gesten bilden meist reale Objekte und Formen ab, beispielsweise einen Rahmen, welcher einen Bereich markiert (vgl. Königs:3). Auch die z.B. auf dem iPhone verwendeten Gesten zum Zoomen, Rotieren etc. gehören zu den ikonischen Gesten, oder wie in diesem Projekt von Wichtigkeit, Gesten, welche sich an Buchstaben orientieren. Deiktische Gesten Deiktische Gesten sind Zeigegesten, mit welchen beispielsweise auf Personen, Objekte oder in eine Richtung gedeutet wird. Sie sind kulturell unabhängig und besonders intuitiv anwendbar (vgl. Königs:3). 11.0 Quellenverzeichnis 11.1 Weblinks 01 http://www.betanews.com/article/Windows-Embedded-Standard-7-released-is-it-ready-for-TV-yet/1272399154 02 http://www.betanews.com/article/Windows-Embedded-Standard-7-released-is-it-ready-for-TV-yet/1272399154 03 http://www.pctipp.ch/index.cfm?pid=1317&pk=51320 04 http://www.peopleoflava.com/television/scandinavia/ 05 http://connectedtv.yahoo.com/ 06 http://www.nytimes.com/2010/03/18/technology/18webtv.html 07 http://www.engadget.com/2010/04/29/google-sony-intel-and-logitechs-tv-project-to-be-unveiled-next/ 08 http://www.celloiviewer.com/ 09 http://www.spiegel.de/netzwelt/gadgets/0,1518,637660-2,00.html 10 http://people.zhdk.ch/tobias.koller/BAprocess/?p=431 11 http://people.zhdk.ch/tobias.koller/BAprocess/?p=433 12 http://www.engadget.com/2010/04/29/google-sony-intel-and-logitechs-tv-project-to-be-unveiled-next/ 13 http://www.textratech.com/SoftwareHowItWorksAnim.htm 14 http://www.logitech.com/de-at/keyboards/keyboard/devices/3848 15 http://www.itechnews.net/2009/11/25/wireless-handheld-keyboard-with-touchpad/ 16 http://www.trust.com/products/product.aspx?artnr=14909 17 http://www.loopygadgets.com/msi-air-keyboard-mouse/ 18 http://glidetv.com/ 19 http://www.ergo2work.de/products/de/contour-rollermouse.html 20 http://www.wacom.eu/index2.asp?pid=294&lang 21 http://nuigroup.com/forums/viewthread/8933/P0/ 22 http://www.benchun.net/flosc/ 23 http://www.bytearray.org/?p=91 24 http://people.zhdk.ch/tobias.koller/BAprocess/?p=463 25 http://www.wacom.eu/index2.asp?pid=294&lang=de&spid=1 26 http://www.visionobjects.com/handwriting_recognition/onlinestore.htm 27 http://www.tcbmi.com/strokeit/ 11.2 Literaturverzeichnis Arnall, Timo (2008) : The Web in the World. Vortrag, Web Expo 2.0, Berlin, http://www.slideshare.net/tmo/the-web-in-the-world-presentation Dourish, Paul (2001) : Where the action is : the foundation of embodied interaction. MIT Press, Cambridge, Ma. Greenfield, Adam (2006) : Everyware – The dawning age of ubiquitous computing. New Riders, Berkeley CA Hinckley, Ken (2008):Input technologies and techniques, in: Sears, Andrew / Jacko, Julie (Hrsg.): The Human Computer Interaction Handbook, New York, 2008, S. 161-176. IBM (2009) : Innovationen – Ein smarter Planet, http://www-05.ibm.com/innovation/ch/ introduction_signs.html Königs, Bastian (2005): Interaktion mittels Gestik, Animation. Universität Ulm, S.1-13. Lipp, Lauritz L. (2004) : Interaktion zwischen Mensch und Computer im Ubiquitous Computing. LIT Verlag, Münster McCullough, Malcolm (2004) : Digital Ground – Architecture, Pervasive Computing, and Environmental Knowing. MIT Press, Cambridge, Ma. Page, Will (2009) : The long tail of P2P, in: Economic Insight No, 14 /09 http://www.prsformusic.com/creators/news/research/Documents/ Rinott, Michal (2005) : SonicTexting. Interaction Design Institute Ivrea, S.1-2. Tao, Xiaoming (2005) : Wearable electronics and photonics. Woodhead Publishing, Cambridge Yang Cai, Julio Abascal (Hrsg.) (2006) Ambient Intelligence in Everyday Life. Springer Verlag, Berlin Heidelberg 12.0 Anhang 12.1 Anhang 1 : Grafiken zu den Usertests : User 1 Nutzungszweck Organisation Private Nutzung Skype / Chat Word etc. Facebook Mail YouTube Recherche Spassbrowsen Online Games Online einkaufen News Links zeigen Blogs Filme streamen Videos zeigen Partykalender Musik hören 2 Öffentliche Nutz. Musik-Videos 3 4 Arbeit Info 5 6 Sozial Spass 12.1 Anhang 1 : Grafiken zu den Usertests : User 2 Nutzungszweck Organisation Private Nutzung Skype / Chat Word etc. Facebook Mail YouTube Recherche Spassbrowsen Online Games Online einkaufen News Links zeigen Blogs Filme streamen Videos zeigen Partykalender Musik hören 2 Öffentliche Nutz. Musik-Videos 3 4 Arbeit Info 5 6 Sozial Spass 12.0 Anhang 12.1 Anhang 1 : Grafiken zu den Usertests : User 3 Nutzungszweck Organisation Private Nutzung Skype / Chat Word etc. Facebook Mail YouTube Recherche Spassbrowsen Online Games Online einkaufen News Links zeigen Blogs Filme streamen Videos zeigen Partykalender Musik hören 2 Öffentliche Nutz. Musik-Videos 3 4 Arbeit Info 5 6 Sozial Spass 12.2 Anhang 2 : Moodboard 12.0 Anhang 12.3 Anhang 3 : wantee-Kurzanleitung 12.4 Anhang 4 : Screenshots : Areas 12.0 Anhang 12.4 Anhang 4 : Screenshots : Web-Module 12.4 Anhang 4 : Screenshots : Bookmarks-Modul 12.0 Anhang 12.4 Anhang 4 : Screenshots : TV-Module 12.4 Anhang 4 : Screenshots : URL-Module