Themen für Bachelor/Masterarbeiten im Bereich Optimierung Institut
Transcription
Themen für Bachelor/Masterarbeiten im Bereich Optimierung Institut
Themen für Bachelor/Masterarbeiten im Bereich Optimierung Institut für Optimierung und Diskrete Mathematik Bettina Klinz Stand 2012 — Update für 2013 in Arbeit Im Anschluss werden mögliche Themen für Bachelorthemen vorgeschlagen. Einige davon sind auch für Masterarbeiten geeignet. Weitere Themen sind auf Anfrage verfügbar. 1 Earliest arrival flows In klassischen Netzwerkflußmodellen wird die Zeit, die für die Flußverschickung über Kanten benötigt wird, nicht berücksichtigt. Das Konzept von dynamischen Flüssen (dynamic flows, flows over time) nimmt sich dieser Schwachstelle an. Für jede Kante (i, j) wird neben den aus dem klassischen Modell bekannten Kapazitäten uij die Durchflusszeit (transit time) τij angegeben, die bestimmt wielange der Fluss von i nach j benötigt. Ferner ist ein Zeithorizont T gegeben. Ein maximaler dynamischer Fluss ist ein dynamischer Fluss, der innerhalb des Zeithorizonts die maximal mögliche Flussmenge versendet. Ein earliest arrival flow (EAF) maximiert die verschickte Flussmenge nicht nur zur Zeit T , sondern auch zur Zeit T − 1, T − 2 etc. EAFs finden Anwendungen z.B. in Evakuierungsproblemen. Bereits seit den 1960-ern weiss man, dass für den Fall einer Quelle und einer Senke stets ein EAF existiert und dass sich ein solcher in pseudopolynomialer Zeit berechnen läßt (siehe Gale [12] bzw. Minieka [28]). Hoppe und Tardos [22] gaben ein FPTAS für diesen Spezialfall an, der auf einer Skalierungsidee beruht. Für serielle parallele Graphen kann ein EAF in polynomialer Zeit gefunden werden [33]. Der Mehrquellen bzw. Mehrsenken-Fall ist komplizierter. Hier ist i.a. nicht einmal die Existenz eines EAF gesichert. Im Fall mehrerer Quellen und einer Senke gilt weiterhin, dass stets ein EAF existiert, die Bestimmung eines solchen ist aber aufwendiger als im Fall einer Quelle und einer Senke. Hajek und Ogier [19] entwickelten den ersten polynomiellen Algorithmus für den Spezialfall mit τij = 0 für alle Kanten (i, j). Fleischers Algorithmus [9] löst dieselbe Aufgabe effizienter. Fleischer und Skutella [11] schlugen ein FPTAS vor. Im Fall einer Quelle und mehrerer Senken ist die Existenz eines EAF nicht gesichert. Schon für eine Quelle und zwei Senken sind einfache Beispiele bekannt, für die kein EAF existiert (siehe [9, 5]. Selbst im Spezialfall, dass τij = 0 für alle Kanten (i, j) gilt, ist die Existenz eines EAF nicht garantiert. Skutella und Schmidtschmidt gelingt es jedoch für diesen Spezialfall die Netzwerke zu charakterakterisieren für die unabhängig von der konkreten Instanz stets ein EAF existiert. Während sich die bisher genannten Arbeiten mit dem Fall beschäftigen, in dem die Kapazitäten und Durchflusszeiten konstant sind, ist im Fall von Evakuierungsproblemen der Fall zeitabhängiger Kantendaten besonders interessant. EAFs mit zeitabhänigen Daten wurden u.a. von Tjandra und Hamacher [37, 20] und Baumann und Köhler [4] untersucht. Ziel der Arbeit: Es soll ein Überblick zum Thema EAF gegeben werden. Ferner sollen für ein spezielles EAF-Problem (Wahl nach Absprache) ein Algorithmus implementiert werden und an einigen Testbeispielen getestet werden. Je nach individuellen Interessen kann das Thema eher theorielastig oder praktischer (mehr Gewicht auf Anwendungen in Evakuierungsproblemen) ausgelegt werden. 1 2 Sports elimination problems Ein klassisches Problem, das bereits in den 1960-er Jahren erstmals untersucht wurde, ist, ob ein Baseball-Team zu einem bestimmten Zeitpunkt der Meisterschaft noch Meister werden kann oder nicht. Etwas spezifischer: Gegeben sind n Baseballteams einer Liga. Zu einem konkreten Zeitpunkt der Meisterschaft habe Team i wi Siege erworben und es verbleiben gij zu absolvierende Partien zwischen Teams i und j. Ein Team wird eliminiert genanntm wenn es es nicht möglich ist, daß dieses Team am Ende der Meisterschaft Platz 1 einnimmt (evtl. zusammen mit punktegleichen Teams). Schwartz [35] führte die Fragestellung, ob ein einzelnes Team eliminiert ist, auf ein maximales Flussproblem zurück. Hoffman und Rivlin [21] verallgemeinerten dieses Ergebnis und charakterisierten, wann ein Team nicht mehr Platz q erreichen kann. Gusfield und Martel[16] und McCormick [27] bestimmten die sogenannte Eliminationszahl, das ist die minimale Anzahl verbliebener Partien, die ein Team gewinnen muss, um eine Chance auf Platz 1 zu haben. Die Methoden greifen auf Ergebnisse zu parametrischen maximalen Flussproblemen zurück [13]. Ferner zeigte McCormick, dass es NP-vollständig ist zu entscheiden, ob ein Team noch mindestens Platz q erreichen kann. Wayne [46] zeigte, daß es eine Schwellwertpunktzahl W ∗ gibt, sodass gilt, daß Team i genau dann eliminiert ist, wenn wi + gi < W ∗ wobei gi die Anzahl der Spiele bezeichnet, die Team i noch zu absolvieren hat. Basierend auf dieser Charakterisierung lassen sich alle eliminierten Teams mithilfe eines einzigen maximalen Flussproblems bestimmen. Ein analoges Strukturresultat zeigten unabhängig davon Adler et al. [1] unter Verwendung von linearen Programmierungsmethoden. Gusfield und Martel verallgemeinern die Charakterisierungen aus [46] und [1]. Es werden allgemeinere Schwellwertresultate erzielt, u.a. auch für den Fall von Fussball. Die Ergebnisse werden auf nicht algorithmischem Wehe hergeleitet. Die Arbeit enthält auch neue Komplexitätsergebnisse zu verwandten Fragestellungen. Bernhold et al. [6] untersuchen das Eliminationsproblem für Fussball für die Situation in der der Sieger 3 Punkte erhält und zeigen, dass das Problem NP-vollständig ist. Kern und Paulusma [24] untersuchen die Komplexität einer allgemeineren Problemstellung von Bewerbsformen, bei denen es mehr als 3 mögliche Ausgänge einer Partie gibt. Russell [32] behandelt im ersten Teil seiner Dissertation den komplexeren Fall von Eliminationsproblemen in der NHL (nordamerikanische Eishockey-Liga). Ziel der Arbeit ist es einen Überblick über (einen Teil) der betrachteten Fragestellungen und erzielten Ergebnisse zu geben. Je nachdem ob die Arbeit eher theoretisch oder eher praktisch ausgerichtet wird, soll für ein ausgewähltes Teilproblem ein effizienter Algorithmus implementiert und getestet werden. Details können individuell je nach persönlichen Präferenzen abgesprochen werden. 3 Bestimmer spezieller (partieller) lateinischer Quadrate Ein lateinisches Quadrat der Ordnung n ist eine n × n Matrix, die in jeder Zeile und in jeder Spalte jede Zahl von 1 bis n genau einmal enthält. Sei ein lateinisches Quadrat L der Ordnung n gegeben. di (k, l) bezeichne den Absolutbetrag der Differenz der Indices der Spalten, die die Einträge k bzw. l in Zeile i enthalten. Die durchschnittliche Distanz zweier Zahlen aus der Menge {1, . . . , n} in L ist gegeben durch d(k, l) = n 1X di (k, l). n i=1 Ein lateinisches Quadrat wird totally spatially balanced genannt, wenn d(k, l) = k < l ≤ n gilt. 2 n(n+1) 3 für alle 1 ≤ Das Problem solche lateinisches Quadrate zu finden, wird hier in der Folge als TBLS Problem bezeichnet. Das TBLS Problem spielt eine Rolle im Design von experimentellen Untersuchungen z.B. in der Landwirtschaft, siehe [41, 42] und http://www.cs.cornell.edu/gomes/SBLS.htm. Es ist kein polynomieller Algorithmus zur Konstruktion von lateinischen Quadraten, die totally spatially balanced sind, bekannt und auch das Problem zu charakterisieren, wann solche existieren ist offen. (Es ist einfach einzusehen, dass n nicht kongruent 1 modulo 3 sein darf.) In der Literatur sind Ansätze beschrieben, die versuchen das TBLS Problem mit Methoden aus dem Bereich der kombinatorischen Optimierung (lokale Suchmethoden und Metaheuristiken) und aus dem Bereich constraint programming anzugehen. Gomes et al. [14] beschreiben einen Ansatz mit simulated annealing. Der Ansatz ähnelt einem Ansatz für das Travelling Tournament Problem. Weitere Ansätze und Verfeinerungen, u.a. in bezug auf die verwendeten Nachbarschaften finden sich in den Arbeiten von van Hentenryck et al. [43] and Smith et al. [36]. Ziel der Arbeit ist es die bekannten Ergebnisse zum TBLS Problem zusammenzustellen sowie einen Ansatz zur Generierung von lateinischen Quadraten, die totally spatially balanced sind, zu implementieren und damit zu experimentieren. Im Umfeld von lateinischen Quadraten gibt es ferner weitere Themen für Bachelor- und Masterarbeiten, die auf Anfrage näher beschrieben werden können. Lateinische Quadrate und unvollständige lateinische Quadrate spielen u.a. einen Rolle in planaren 3-dimensionalen Zuordnungsproblemen, das zu meinen aktuellen Forschungsinteressen gehört. 4 The travelling tournament problem Das Travelling Tournament Problem ist ein Zeitplan-Erstellungsproblem, das im Bereich des Sports auftritt und von der Problematik, die bei der Erstellung des Spielplans in der MLB (Major League Baseball) in Nordamerika auftritt. In dieser Liga spielen 30 Teams 162 Spiele, die über einen Zeitraum von 180 Tagen von Anfang April bis Ende September verteilt sind. Im realen Problem sind Hunderte von Rand- und Nebenbedingungen zu berücksichtigen. Die wichtigsten zu berücksichtigenden Aspekte ergeben sich aber aus der Reiseproblematik für die Teams und dem Muster von Heim- und Auswärtsspielen. Auf der einen Seite möchten die Teams ihre Gesamtreisedistanz klein halten, aber auf der anderen Seite möchte kein Team zu lange vom Heimatort abwesend sein oder zu lange nur am Heimatort Spiele abhalten. Ähnliche Problemstellungen treten auch in anderen Sportarten auf. Das Travelling tournament Problem TTP stellt den Versuch dar, Problemstellungen der obigen Art zu abstrahieren, und läßt sich wie folgt beschreiben ([7]): Wir betrachten n Teams (n sei gerade) und ein Turnier in dem jedes Team zweimal gegen jedes andere Team spielt, einmal auswärts und einmal zuhause. Es werden genai 2(n−1) Zeitslots für alle Partien eines solchen Turniers benötigt. Die Distanzen zwischen den Heimatstadien der Teams seien in der n × n Matrix D dargestellt. Jedes Team startet an seinem Heimatort, reist zu den Spielen, und reist am Ende (falls nötig) wieder nach Hause. Aufeinanderfolgende Auswärtsspiele definieren eine Auswärtspielkomplex (Spielreise, road trip). Aufeinanderfolgende Heimspiele definieren einen Heimspielkomplex (home stand). Die Länge eines solchen Komplexes ist die Anzahl der Spielgegner. Ziel im TTP ist es für gegebenes n, D und zwei Distanzschranken L und U einen Spielplan der oben beschriebenen Art zu finden sodass alle Auswärts- und Heimkomplexe eine Länge zwischen L und U aufweisen und sodass die Gesamtreisedistanz der Teams minimiert wird. 3 Die Parameter L und U sorgen für einen Trade-off zwischen Reisedistanz und Aspekten, die das HeimAuswärtsmuster betreffen. Für L = 1 und U = n − 1, liegt die größte Freiheit vor. Die Minimierung der Reisedistanz und damit der TSP-Aspekt, steht im Vordergrund. Für kleine Werte von U muss ein Team oft heimreisen und die Gesamtreisedistanz wird dadurch i.a. ansteigen. Thielen und Westphal [39] zeigten, dass das TTP für U = 3 NP-schwer ist. Das TTP stellt sich in der Praxis als sehr viel unangenehmer als das TSP heraus. Selbst recht kleine Instanzen stellen einen echten Challenge dar. Die besten oberen Schranken wurden mit Metaheuristiken erzielt, siehe [40, 44, 2]. Die Arbeiten [8, 31] beschäftigen sich mit exakten Ansätzen für das TTP. In den letzten Jahren rückte zunehmend auch der Approximationsaspekt in das Zentrum des Interes9 - Approximationsalgorithmus für den metrischen ses. Miyashiro et al. [29] entwarfen einen 2 + 4(n−1) Spezialfall des TTP mit U = 3. In Yamaguchi et al. [48] werden die Ergebnisse aus der Vorarbeit verbessert und erweitert. Für den Fall U = 3 resultiert eine 5/3 + 1/n-Approximation. Thielen und Westphal [38] behandeln den Fall U = 2. Westphal und Noparlik [47] untersuchen den Fall U ≥ 3. Bhattacharyya [3] zeigte, dass das TTP mit U = n − 1 NP-schwer ist. Imahori et al. [23] präsentieren einen 2.75-Approximationsalgorithmus für den metrischen Spezialfall. Ziel der Arbeit ist es sich mit dem TTP auseinanderzusetzen. Ob der Schwerpunkt mehr auf die heuristisch-praktische Seite oder die theoretische Seite gelegt wird, ist abhängig von der Interessenslage des Bearbeiters des Themas. Diese Themenstellung eignet sich zur Behandlung mit Metaheuristiken (simulated annealing, Tabu Suche etc.) 5 Combinatorial optimization problems in computational biology Im Gebiet, das sich computational biology nennt tritt eine Vielfalt von kombinatorischen Optimierungsproblemen auf. Eine grobe Übersicht liefern z.B. die Bücher von Waterman [45] und Gusfieldgusfield. Je nach Interessenslage des Bearbeiters lassen sich in diesem Bereich unterschiedliche Themenstellungen für Bachelor- und Masterarbeiten angeben. Als Beispiel sei die Arbeit von Gusfield et al. [18] genannt, die auf einen Spezialfall des TSP führt. Ideen könnte auch ein Blick auf die Webseite von Ron Shamir http://www.cs.tau.ac.il/ rshamir/ sowie die Webseite von Dan Gusfield http://www.cs.ucdavis.edu/ gusfield/ liefern. Literatur [1] I. Adler, A. L. Erera, D. S. Hochbaum, E. V. Olinick, Baseball, optimization, and the world wide web, Interfaces 32, 2002, 12-22. [2] A. Anagnostopoulos, L. Michel, P. van Hentenryck, Y. Vergados, A simulated annealing approach to the traveling tournament problem, Journal of Scheduling 9, 2006, 177-193. [3] R. Bhattacharyya, A note on complexity of traveling tournament problem, available from Optimization Online, 2009, http://www.optimization-online.org/. [4] N. Baumann, E. Köhler, Approximating earliest arrival flows with flow-dependent transit times, Discrete Applied Mathematics 155, 2007, 161-171. [5] N. Baumann, M. Skutella, Solving evacuation problems efficiently: Earliest arrival flows with multiple sources, Mathematics of Operations Research 34, 2009, 499-512. 4 [6] T. Bernholt, A. Gülich, T. Hofmeister, N. Schmitt, Football elimination is hard to decide under the 3-point-rule, in: Mathematical Foundations of Computer Science 1999, Lecture Notes in Computer Science, Vol. 1672, Springer, Berlin, 1999, pp. 410-418. [7] K. Easton, G. Nemhauser, M. Trick, The Travelling Tournament Problem: Description and Benchmarks, in Principle and Practises of Constraint Programming - CP 2001, Springer Lecture Notes in Computer Science 2239, 2001, 580–585. [8] K. Easton, G. Nemhauser, M. Trick, Solving the Traveling Tournament Problem: A Combined Integer Programming and Constraint Programming Approach, E. Burke and P. Causmaeher (eds.), Springer Lecture Notes in Computer Science 2740, 2004, 63–77. [9] L.K. Fleischer, Faster algorithms for the quickest transshipment problem, SIAM Journal on Optimization 12, 2001, 18-35. [10] L.K. Fleischer, E. Tardos, Efficient continuous-time dynamic network flow algorithms, Operations Research Letters 23, 1998, 71-80. [11] L.K. Fleischer, M. Skutella, Quickest flows over time, SIAM Journal on Computing 36, 2007, 1600-1630. [12] D. Gale, Transient flows in networks, Michigan Mathematical Journal 6, 1959, 59-63. [13] G. Gallo, M. D. Grigoriadis, R. E. Tarjan, A fast parametric maximum flow algorithm and applications, SIAM Journal on Computing 18, 1989, 30–55. [14] C. Gomes, M. Sellmann, C. van Es, H van Es, The challenge of generating spatially balanced Scientific experiment designs, in: Proc. of Conf. on Integration of AI and OR Techniques in Constraint Programming for Combinatorial Optimization Problems (CP-AI-OR ’04), 2004. [15] D. Gusfield, Algorithms on Strings, Trees and Sequences, Cambridge University Press, 1997. [16] D. Gusfield, C. Martel, A fast algorithm for the generalized parametric minimum cut problem and applications, Algorithmica 7, 1992, 499–519. [17] D. Gusfield, C. Martel, The structure and complexity of sports elimination numbers Algorithmica, 32, 2002, 73–86. [18] D. Gusfield, R. Karp, L. Wang, P. Stelling, Graph traversals, genes and matroids: an efficient case of the travelling salesman problem, Discrete Applied Mathematics 88, 1998, 167–180. [19] B. Hajek, R. G. Ogier, Optimal dynamic routing in communication networks with continuous traffic, Networks 14, 4574-87. [20] H.W. Hamacher, S.A. Tjandra, Earliest arrival flow model with time dependent capacity for solving evacuation problems. Pedestrian and Evacuation Dynamics, 2002, 267-276. [21] A. Hoffman, T. Rivlin, When is a team “mathematically” eliminated? In: Princeton Symposium on Mathematical Programming (1967), 1970, pp. 391–401, 1970. [22] B. Hoppe, ´. Tardos, Polynomial time algorithms for some evacuation problems, in: Proceedings of the Fifth Annual ACM-SIAM Symposium on Discrete Algorithms (SODA), ACM, 1994. [23] S. Imahori, T. Matsui, R. Miyashiro, A 2.75-approximation algorithm for the unconstrained traveling tournament problem, arXiv:1110.0620v1, October 2011. [24] W. Kern, D. Paulusma, The computational complexity of the elimination problem in generalized sports competitions, Discrete Optimization, 1, 2004, 205–214. 5 [25] H. Konno und H. Yamazaki, Mean-absolute deviation portfolio optimization model and its applications tu Tokyo stock market, Management Science 37(5), 519-531, 1991. [26] Peter Korteweg, Postman problems, priorities and the concept of serving, Master Thesis, Unversity of Amsterdam, 2002. [27] S. T. McCormick, Fast algorithms for parametric scheduling come from extensions to parametric maximum flow. [28] E. Minieka, Maximal, lexicographic, and dynamic network flows, Operations Research 21, 1973, 517-527. [29] R. Miyashiro, T. Matsui and S. Imahori, An approximation algorithm for the traveling tournament problem, Annals of Operations Research 194, 2008, 317–324. [30] M. Monaci und U. Pferschy, On the robust knapsack problem, verfügbar via Optimization Online 2011-04-3019, 2011. [31] C.C. Ribeiro, S. Urrutia, OR on the ball: applications in sports scheduling and management, OR/MS Today 31, 2004, 50-54. [32] T.C. Russell, A Computational Study of Problems in Sports, Ph.D. thesis, University of Waterloo, 2010. [33] S. Ruzika, H. Sperber, M. Steiner, Earliest arrival flows on series-parallel graphs Networks 57, 2011, 169-173. [34] M. Schmidt, M. Skutella, Earliest arrival flows in networks with multiple sinks, Discrete Applied Mathematics, 2011. [35] B. Schwartz, Possible winners in partially completed tournaments, SIAM Review 8, 1966, 302– 308. [36] C. Smith, C.P. Gomes, C.Fernndez, Streamlining local search for spatially balanced Latin squares, In: Proceedings of the IJCAI’05, 2005, pp. 1539-1540. [37] S. Tjandra, Dynamic network optimization with application to the evacuation problem, Ph.D. thesis, Universität Kaiserslautern, Shaker Verlag, Aachen, Germany. [38] C. Thielen, S. Westphal, Approximating the traveling tournament problem with maximum tour length 2, Lecture Notes in Computer Science 6507, 2010, 303-314. [39] C. Thielen, S. Westphal, Complexity of the Traveling Tournament Problem, Theoretical Computer Science, 412, 2011, 345–351. [40] M. Trick, Challenge travelling http://mat.gsia.cmu.edu/TOURN/. tournament problems, Webseite zum TTP [41] H. van Es, C. van Es, The spatial nature of randomization and its effects on outcome of field experiments, Agronomy Journal 85, 1993, 420–428. [42] H. van Es, C. Gomes, M. Sellmann, C. van Es, Spatially-balanced complete block designs for field experiments Geoderma Journal, 140, 2007 346–352. [43] P. van Hentenryck, L. Michel, Differentiable invariants, available http://www.cs.brown.edu/people/pvh/pvhHome/Pub 2006.html, 2006. 6 online at [44] P. van Hentenryck, Y. Vergados, Traveling tournament scheduling: a systematic evaluation of simulated annealing, Lecture Notes in Computer Science 3990, 2006, 228-243. [45] M.S. Waterman, Introduction to Computational Biology: maps, sequences and genomes, Chapman and Hall, 1995. [46] K. Wayne, A new property and faster algorithm for baseball elimination. SIAM Journal on Discrete Mathematics, 14, 2001, 223–229. [47] S. Westphal, K. Noparlik, A 5.875-approximation for the traveling tournament problem, In: Proceedings of the 8th International Conference on the Practice and Theory of Automated Timetabling (PATAT), [48] D. Yamaguchi, S. Imahori, R. Miyashiro, T. Matsui, An improved approximation algorithm for the traveling tournament problem, Lecture Notes in Computer Science 5878, 2009, 679–688. 7