Cool erwägt Raceswitch für GSL2

Chise · 27.09.2010

Freerider schrieb:
Warum?

Je mehr spiele du spielst, desto genauer kann das System deinen Skill einordnen. D.h. je mehr du spielst, desto gleichwertiger werden deine Gegner. Bei gleichstarken Gegnern gewinnst du ca. 50% aller Spiele anstatt mehr als 50%, wenn du gegen schwächere Gegner spielst.

Kiffkind · 27.09.2010

Außer du bist Top Spieler. Idra hat trotz Games en mass, ne win ratio von ca.79%

Evilshady · 27.09.2010

Misfit schrieb:
warum das denn?

P und T spielen sich viel intuitiver, wenn man einen Grundskill mitbringt und bisschen sich was von Pros abschaut und die absolutenm Basisdinge verinnerlicht hat, kann man schon gut was mit denen reißen.
Als Zerg muss man erstmal durch 1000 Games, um abschätzen zu können, wann man wieviele Units gegen was haben muss, also eigentlich trockene Theorie, die man aber halt nur durch Spielerfahrung erlangt, auch wenns paradox klingt.

Als P oder T hast halt, wenn die Mechanics erstmal stimmen, immer mehr oder weniger gleich viele Units, und es kommt eher drauf an, wie du deine Army microest, Situationen taktisch abschätzt (und entsprechend microest), und gleichzeitig das Makro-Multitasking nicht vernachlässigst.
Mit den Z Units kannste nicht allzu viel microen, der Anspruch liegt eher darin, das Makro-Multitasking in Verbindung mit dem taktischen Auswerten von Scoutinginformationen (Scouting ist für Z viel wichtiger als für die anderen Rassen, deswegen ist es ja auch schwerer und verlangt Micro und Opfern von Resourcen, weils eben ein Grundanspruch der Rasse ist, während man Scan und Observer halt locker mitnimmt weils vergleichsweise nebensächlich ist).

Und da ist nunmal das Problem, dieses "Auswerten von Scoutinginformationen", das ist von Z das Äquivalent zu Ps und Ts Micro.
P und T spielen sich mechanischer, während Z halt auf Gedächtnis und Logik aufbaut. Dazu kommt, dass ein Z keine Fights gewinnen soll, sondern seine Armee möglichst schnell nachbauen können.
Wie soll man das also balancen? Scheint ziemlich schwer.
Ps und Ts Aufgabe is halt klassisch, möglichst effektiv seine Armee einsetzen, um den Z früh genug plattzumachen oder kleinzuhalten, Scouten is eher ne Nebensache, Hauptsache man erwischt den Zerg überall.
Zerg darf die gegnerische Armee aber nur "ansatzweise" zerstören, da sie halt eher mit der Map und der Makromechanik arbeiten. Die Makromechaniken von P und T sind nix, die sind nur da um den Spieler bisschen zu beschäftigen, irgendwann is die Makromechanik von T eh nur Scan. Die von Z ist extra so hart und unverzeihlich, weil sie den Skill mit der Rasse viel mehr ausmacht bzw ausmachen soll.
Jedenfalls ist es für das Balancingteam unglaublich schwer herauszufinden, wieviel Schaden die Zerg-Units bei "anständigem" Micro an der Gegnerarmee machen dürfen, damits fair ist, und zum anderen, inwieweit wirklich gutes Scouting sich auszahlt, sprich, ob man Schwachstellen beim Gegner auch gut ausnutzen kann.

Beispielsweise isses ja so, wenn P und T beide mit aufgedeckter Karte spielen, ändert sich nicht allzu viel am Spiel, T baut halt seine Rax, P seine Gates, kackt die Units raus und ab geht die Post, wer besseres Micro hat gewinnt.
Wenn jetzt aber ein Z im Spiel ist, und beide haben aufgedeckte Karte, wäre der Zerg gnadenlos im Vorteil.

Ja bin bisschen vom Thema abgekommen, jedenfalls isses schwer, Z zu balancen, ich wünsch Blizzard da viel Spaß bei, das wird nicht einfach, ich hätt da keine Lust zu aber ich ich hab mit Z eigentlich noch ganz gut Spaß.
Z muss halt massgamen, um das Scouten zu üben, und anhand der Scoutinformationen zu entscheiden, was in den Eiern denn drinstecken soll.
Denn, und das ist ziemlich hartes Brot: Man muss sein Larvenmanagement auch abhängig vom Skill seines Gegners machen.
Als Beispiel: Du weisst, dein Gegner kommt gleich mit 10 Stalkern und 2 Sentries an und fragst dich, wieviele Hyden ich jetzt bauen soll. Und das ist deshalb so schwer abzuschätzen, weil man mal gegen welche spielt, die einem mit 5 Stalkern 20 Hyden wegrotzen, während andere mit doppelt so vielen Stalkern verkacken würden (sind natürlich jetzt beliebige Beispiele).
Daher ist bei Z "raten" anhand von was man schon alles gesehn hat viel gewichtiger, als es sein dürfte.

Templer · 27.09.2010

@Kiffkind
Zitat: "Außer du bist Top Spieler. Idra hat trotz Games en mass, ne win ratio von ca.79%"

Richtig, gelistet nach den absoluten Top-Spielern weltweit die in der Diamond-League sind mit einer Anzahl von mindestens 200 getätigten Spielen, haben 28 Spieler eine Win-Ratio von 70% und mehr. D.h. da findet das MMS einfach keine ebenbürtigen Gegner mehr...Wahnsinn

Festzuhalten bleibt folgendes bei dem Tag der Statistiken im SC2-Forum:

Es gibt Indizien, dass es generell eine schwerere Rasse ist, aber mit vorhandenem Skill durchaus fast ebenbürtig, aber auch nur fast...

Bei den besten 100 Spielern (mit mehr als 200 Spielen) mit der besten Win/Loss-Ratio weltweit, sind 16 Zerg darunter, entspricht 16%. Aufholbedürftig, da 26% Zergs unter den Top5000 sind und dies auch in etwa prozentual die Zergs komplett in Diamond widerspiegelt.

miro99 · 27.09.2010

IMB111 schrieb:
wirklich genau nachweisen kann mans nicht, man kann nur Indizien sammeln, wie eben Verteilung der Turniersiege nach Rassen
ums wirklich wasserdicht zu haben, müssten sämtliche Spieler nen raceswitch machen und die Rasse dann auf gleichem "Niveau" wie ihre alte spielen, wenn sich dann abzeichnet, dass Z immer noch schlechter abschneidet, wäre quasi "bewiesen" dass es an der Rasse und nicht an den Spielern liegt

so und nicht anders.

Man kann es an keiner Tunier- oder Ladderstatistik festmachen.
Wenn sich sehr wenig gute Spieler für Zerg als mainrasse entschieden haben, gewinnen halt auch sehr wenige spieler in tunieren und der ladder.
Wenn die Rasse Zerg schlechter als die anderen beiden Rassen ist, gewinnen ebenfalls sehr weniger Zergspieler in tunieren und der Ladder.
Von daher weiß man einfach nicht woran es liegt.
Auch wenn 2. wahrscheinlicher ist, kann man sich nicht sicher sein.

ragingbbq · 28.09.2010

Ich spiele Zerg und sehe als Herausforderung, allerdings bin ich auch manchmal schon kurz vorm Ausrasten... ^^

Bootdiskette · 28.09.2010

Misfit schrieb:
was du dafür bräuchtes wären die replays aller ladder games und am besten nen komplettes rechenzentrum um mit der datenmenge brauchbare ergebnisse vor weihnachen 2031 zu bekommen

jein.
ja ich bräuchte idealerweise die replays, aber es würde schon für einige schlüsse reichen wenn man die win/loss-statistiken, spieldauer und rassen sowie spieler-ids (wg. panel-effekten) hat.
die berechnung einer panelschätzung mit arrelano-bond-gmm oder tobit braucht jedoch nicht bis 2031 sondern selbst bei einem datensatz von mehreren millionen fällen mit Stata/MP nur minuten (wenn überhaupt, und Stata ist generell eher schwach im Umgang mit großen Datensätzen).

nein, es ginge wirklich recht einfach.

die fragen die man mit den quasiöffentlichen bnet-daten klären könnte, wäre z.b. welche rasse gegen welche am ehesten gewinnt, wie und ob sich das mit fortlaufender dauer eines spiels ändert, ob es starke lerneffekte gibt (#spiele wirkt auf winratio) die nach race verschieden sind. etc.pp.
ich würde sogar fast vermuten dass blizzard selbst solche analysen macht. einen statistiker damit zu beschäftigen ist durchaus nicht zu teuer, weil es bestimmt genügend zu balancen gibt im gesamten spieleportfolio von blizzard/activision.

kirdie · 28.09.2010

Das wäre doch das ideale Masterarbeitsthema für einen angehenden Statistiker: "Ist Zerg balanced oder nicht?" :-)

Bootdiskette · 28.09.2010

Ich bin (quasi) angehender Statistiker und fange grad an meine Diplomarbeit zu schreiben

Das Problem wäre: Die Daten sind im benötigten Detailgrad nicht zu bekommen (Replayinfo extrahieren) weil ich nicht programmieren kann, zumindest nicht in echten Programmiersprachen sondern nur in Modellierungssprachen wie Stata, Matlab, R ...; zusätzlich ist die Fragestellung zu einfach. Wenn man die Daten hat, ist der Nachweis von beliebigen Sachverhalten vermutlich geradezu lächerlich einfach, denn die Datenmasse ist enorm (Die Sachverhalte bzw. Zusammenhänge müssen natürlich trotzdem existieren damit sie nachweisbar sind. Statistik ist nur dann Lügen wenn man nicht versteht wie's geht :ugly:

).
Außerdem ein Problem: Ich bin Volkswirt mit Schwerpunkt Statistik, ich muss ein Wirtschaftsthema nehmen; und da ist die Datenlage leider fast immer deutlich schlechter.

Chise · 28.09.2010

Bootdiskette schrieb:
Außerdem ein Problem: Ich bin Volkswirt mit Schwerpunkt Statistik, ich muss ein Wirtschaftsthema nehmen; und da ist die Datenlage leider fast immer deutlich schlechter.

"Ist es, in Bezug auf Gewinnmaximierung, sinnvoll Zerg zu spielen?"

Dann packst du ein paar Statistiken zusammen die besagen, dass wenige Zerg Spieler Turniere gewinnen, usw und schon hast du Wirtschaft + Statistik drinnen :ugly:

aNjIrU · 28.09.2010

Auf Turnieren gehts meist um Preisgelder, Geld = Wirtschaft?

Bootdiskette · 28.09.2010

ich weiß ja nicht was ihr in eurer freizeit so arbeitet oder studiert, aber das wäre einfach zu einfach das thema (daten vorausgesetzt).

"ein paar statistiken zusammenpacken" ... bei solchen aussagen rollen sich mir die fußnägel hoch, das ist ne wissenschaft junge :ugly:

dass die preisgelder ein witz sind wenn man sich die summen anschaut die jeden tag durch auch nur eine kleine bank/firma/wertpapierbörse gehen, ist klar ne.

mal ganz im ernst: gibt's hier irgendwen der coden kann, so dass man via skript o.ä. mal ein paar zehntausend spiele vom EU realm auswerten kann? sinnvoll beschaffbar was kosten/nutzen angeht wären datensätze in der form:

spielername; race; gegnername; gegnerrace; punkte_selbst; punkte_gegner; spieldauer; gewinner; sc2version; gespielte_map; spielmodus (1v1);

für jedes spiel eine solche zeile, und es wäre ein leichtes das auszuwerten wenn ich die datei als CSV oder meinetwegen auch Excel (bäh) bekomme.

Chili · 28.09.2010

Bootdiskette schrieb:
die berechnung einer panelschätzung mit arrelano-bond-gmm oder tobit

Was für ne Gleichung würdest du schätzen wollen?

Bootdiskette · 28.09.2010

ich hab ein bisserl überlegt.
win/loss als dummy, und dann erstmal ein normales tobit. in die rhv eben race_self, race_opponent, spieldauer (linear und quadratisch), map, modus, plus alle möglichen crossterme
die spieler-ids würde ich erstmal rauslassen, könnte man aber später durch ein SUR berücksichtigen, jedoch weiß ich jetzt nicht aus dem ärmel ob es bei Stata oder überhaupt einen tobit-SUR schätzer gibt. habe gestern rausgefunden dass es immerhin einen panel-tobit gibt, was schon krass ist. hab jetzt alles gemacht was es für volkswirte an ökonometrie bei uns an der uni zu hören gibt und kenn trotzdem nur die grundzüge :ugly:

das ist jetzt nur ein erster gedanke, wichtig wäre erstmal ein datensatz. alles andere geht eigentlich einigermaßen zügig weil (noch) keine wissenschaftliche arbeit draus werden soll.

ich vergaß: punkte von spieler und gegner reinnehmen wäre noch extrem informativ.

Chili · 28.09.2010

Naja, du hast immer ne unbeobachtbare Variable, nämlich Skill. Zudem sind einige erklärende Variablen endogen. Und das das MMS auf 50% Win Ratio ausgelegt ist, macht die Sache auch nicht einfacher.

Wie so oft gilt: die kompliziertere Methode ist nicht unbedingt die bessere (Lol, willst mit spezialisierten Schätzern für dynamische Panels arbeiten, dabei ist gar nicht klar, ob das Problem überhaubt dynamisch ist). Einer Auswertung nach Win Ratios: Z gewinnt 30% gegen T, 60 gegen P usw. würde ich mehr Glauben schenken. Insbesondere die Abweichungen von den 50% sind interessant, wegen des MMS.

IMB111 · 28.09.2010

Childerich schrieb:
Einer Auswertung nach Win Ratios: Z gewinnt 30% gegen T, 60 gegen P usw. würde ich mehr Glauben schenken. Insbesondere die Abweichungen von den 50% sind interessant, wegen des MMS.

Starke Abweichungen wären in dem Fall nur zu beobachten, wenn der Nachteil des Z gegenüber T stark vom Nachteil gegenüber P abweicht. Nehmen wir einfach mal hypothetisch an Z wäre sowohl gegen T als auch gegen P etwa gleichermaßen benachteiligt. Das würde dazu führen, dass ein Z bei gleichem "Skill" tiefer eingestuft würde als entsprechend gute T/P. Auf diesem tieferen Niveau trifft er dann auf "schwächere" P und T, gegen die er aber aufgrund der imbalance die Quote von 50% erreicht, sowie gleich starke Z, was auch wieder zu 50% winquote führt.
Wirklich starke Abweichungen wären wohl nur zu beobachten, wenn die Rassenbalance nach nem Schere/Stein/Papier-Prinzip funktionieren würden.

DiNaN · 28.09.2010

mal zum thema zurück:
also für 10% winrate is er ja ziemlich weit gekommen.

Chili · 28.09.2010

IMB111 schrieb:
Starke Abweichungen wären in dem Fall nur zu beobachten, wenn der Nachteil des Z gegenüber T stark vom Nachteil gegenüber P abweicht. Nehmen wir einfach mal hypothetisch an Z wäre sowohl gegen T als auch gegen P etwa gleichermaßen benachteiligt. Das würde dazu führen, dass ein Z bei gleichem "Skill" tiefer eingestuft würde als entsprechend gute T/P. Auf diesem tieferen Niveau trifft er dann auf "schwächere" P und T, gegen die er aber aufgrund der imbalance die Quote von 50% erreicht, sowie gleich starke Z, was auch wieder zu 50% winquote führt.
Wirklich starke Abweichungen wären wohl nur zu beobachten, wenn die Rassenbalance nach nem Schere/Stein/Papier-Prinzip funktionieren würden.

Jo stimmt, interessante Bemerkung.

CaptainGut · 28.09.2010

mal zum thema zurück:

Cool/Fruitseller hat heute in der GSL so ziemlich geraged und mit Zerg überzeugend (ein bisschen cheese muss sein) 2-0 gewonnen.

swedel2 · 28.09.2010

Evilshady schrieb:
P und T spielen sich viel intuitiver, wenn man einen Grundskill mitbringt und bisschen sich was von Pros abschaut und die absolutenm Basisdinge verinnerlicht hat, kann man schon gut was mit denen reißen.
Als Zerg muss man erstmal durch 1000 Games, um abschätzen zu können, wann man wieviele Units gegen was haben muss, also eigentlich trockene Theorie, die man aber halt nur durch Spielerfahrung erlangt, auch wenns paradox klingt.

Als P oder T hast halt, wenn die Mechanics erstmal stimmen, immer mehr oder weniger gleich viele Units, und es kommt eher drauf an, wie du deine Army microest, Situationen taktisch abschätzt (und entsprechend microest), und gleichzeitig das Makro-Multitasking nicht vernachlässigst.
Mit den Z Units kannste nicht allzu viel microen, der Anspruch liegt eher darin, das Makro-Multitasking in Verbindung mit dem taktischen Auswerten von Scoutinginformationen (Scouting ist für Z viel wichtiger als für die anderen Rassen, deswegen ist es ja auch schwerer und verlangt Micro und Opfern von Resourcen, weils eben ein Grundanspruch der Rasse ist, während man Scan und Observer halt locker mitnimmt weils vergleichsweise nebensächlich ist).

Und da ist nunmal das Problem, dieses "Auswerten von Scoutinginformationen", das ist von Z das Äquivalent zu Ps und Ts Micro.
P und T spielen sich mechanischer, während Z halt auf Gedächtnis und Logik aufbaut. Dazu kommt, dass ein Z keine Fights gewinnen soll, sondern seine Armee möglichst schnell nachbauen können.
Wie soll man das also balancen? Scheint ziemlich schwer.
Ps und Ts Aufgabe is halt klassisch, möglichst effektiv seine Armee einsetzen, um den Z früh genug plattzumachen oder kleinzuhalten, Scouten is eher ne Nebensache, Hauptsache man erwischt den Zerg überall.
Zerg darf die gegnerische Armee aber nur "ansatzweise" zerstören, da sie halt eher mit der Map und der Makromechanik arbeiten. Die Makromechaniken von P und T sind nix, die sind nur da um den Spieler bisschen zu beschäftigen, irgendwann is die Makromechanik von T eh nur Scan. Die von Z ist extra so hart und unverzeihlich, weil sie den Skill mit der Rasse viel mehr ausmacht bzw ausmachen soll.
Jedenfalls ist es für das Balancingteam unglaublich schwer herauszufinden, wieviel Schaden die Zerg-Units bei "anständigem" Micro an der Gegnerarmee machen dürfen, damits fair ist, und zum anderen, inwieweit wirklich gutes Scouting sich auszahlt, sprich, ob man Schwachstellen beim Gegner auch gut ausnutzen kann.

Beispielsweise isses ja so, wenn P und T beide mit aufgedeckter Karte spielen, ändert sich nicht allzu viel am Spiel, T baut halt seine Rax, P seine Gates, kackt die Units raus und ab geht die Post, wer besseres Micro hat gewinnt.
Wenn jetzt aber ein Z im Spiel ist, und beide haben aufgedeckte Karte, wäre der Zerg gnadenlos im Vorteil.

Ja bin bisschen vom Thema abgekommen, jedenfalls isses schwer, Z zu balancen, ich wünsch Blizzard da viel Spaß bei, das wird nicht einfach, ich hätt da keine Lust zu aber ich ich hab mit Z eigentlich noch ganz gut Spaß.
Z muss halt massgamen, um das Scouten zu üben, und anhand der Scoutinformationen zu entscheiden, was in den Eiern denn drinstecken soll.
Denn, und das ist ziemlich hartes Brot: Man muss sein Larvenmanagement auch abhängig vom Skill seines Gegners machen.
Als Beispiel: Du weisst, dein Gegner kommt gleich mit 10 Stalkern und 2 Sentries an und fragst dich, wieviele Hyden ich jetzt bauen soll. Und das ist deshalb so schwer abzuschätzen, weil man mal gegen welche spielt, die einem mit 5 Stalkern 20 Hyden wegrotzen, während andere mit doppelt so vielen Stalkern verkacken würden (sind natürlich jetzt beliebige Beispiele).
Daher ist bei Z "raten" anhand von was man schon alles gesehn hat viel gewichtiger, als es sein dürfte.

Exzellenter Post, du bringst es auf den Punkt. Leider sind meiner Meinung nach immernoch zu viele Fragen offen:

1. Ist diese "Imbalance" der Rassen-Mechaniken der Grund dafür ist, dass Zerg weniger gespielt wird?
2. Ist der Grund dafür, dass es so wenig Zerg in der Top 200 gibt, dass Zerg schwächer ist (von der Mechanik abgesehen)?
oder
3. Ist der Grund dafür, dass es so wenig Zerg in der Top 200 gibt, dass die Zerg-Mechanik einfach weniger Spaß macht und es DESSWEGEN weniger Spieler (und damit weniger Top-200er) gibt?

Meine Lösung:
Spawn Larva abändern.

Grund:
Spawn Larva ist der Grund warum ich nicht Zerg spiele. Alle 40 Sekunden die Hatches abzuklappern macht einfach null Spaß und ist für mich als Anfänger echt stressig - falls man es vergisst sind die Konsequenzen jedoch verheerend. Falls Protoss CB vergisst oder Terran keine Mules hohlt leiden sie erst druntern wenn die Energie 100% erreicht. Klar, vergisst man den ersten Zealot zu boosten wenn der Gegner 6-poolt bist du auch am Arsch aber theoretisch kann man bei 99% alle Mules runterhohlen und man der Effekt ist genau der selbe. Nicht so wenn ein Zerg ein paar Larven-Spawns verpasst, die kann man nie wieder einhohlen. Spawn Larva ändern: Zerg wird automatisch kompetitiver vs die anderen Rassen UND macht mehr Spaß. Damit sind die beiden (STARK verallgemeinerten) Probleme von Zerg behoben: schwach und langweilig zu spielen.

bami · 28.09.2010

passt zwar nicht zum topic (weil z), aber aus eigener erfahrung kann ich sagen, dass es eigentlich nicht die zergspieler sind, die am meisten rumwhinen, sondern die protosspieler. wirklich in fast JEDEM tvp werde ich geflamt (wenn game losgeht) "imba t" oder "marauder op gg stupid".

z spieler sind da sehr viel "netter" sag ich mal, von denen kommt das in der häufigkeit nicht... glaub pspieler sind einfach schlechtere menschen

vor allem halte ich pvt für ziemlich balanced und mit pvz hat der p ja auch nich gerade das schwerste mu.

EvilLord · 28.09.2010

das könnte auch daran liegen, dass toss vom wesen her eine arrogante spezies ist während sich kommunikation bei den zerg durch ragequits äußert. inkl gegrunze und gezischel. die queen of blades kann nicht überall gleichzeitig sein um die Ts zu flamen.

freeze07 · 28.09.2010

dafür dass er z als so schwach erachtet kommt er aber ganz schön weit in dem tour. hoffentlich gewinnt der das dann gibts ersma keinen buff fürne zergies / nerf für andere rassen.

Miragee · 28.09.2010

freeze07 schrieb:
dafür dass er z als so schwach erachtet kommt er aber ganz schön weit in dem tour. hoffentlich gewinnt der das dann gibts ersma keinen buff fürne zergies / nerf für andere rassen.

ALs ob das davon abhängen würde. Vielleicht ist er auch einfach viel besser als die anderen?^^

Bootdiskette · 28.09.2010

Childerich schrieb:
Naja, du hast immer ne unbeobachtbare Variable, nämlich Skill. Zudem sind einige erklärende Variablen endogen. Und das das MMS auf 50% Win Ratio ausgelegt ist, macht die Sache auch nicht einfacher.

Wie so oft gilt: die kompliziertere Methode ist nicht unbedingt die bessere (Lol, willst mit spezialisierten Schätzern für dynamische Panels arbeiten, dabei ist gar nicht klar, ob das Problem überhaubt dynamisch ist). Einer Auswertung nach Win Ratios: Z gewinnt 30% gegen T, 60 gegen P usw. würde ich mehr Glauben schenken. Insbesondere die Abweichungen von den 50% sind interessant, wegen des MMS.

ad skill: deshalb nehme ich punkte als IV mit rein. man hat generell fast nie die echten variablen sondern immer den messfehler mit drin. damit muss man leben, so ist statistik.

ad endogenität: deshalb meinte ich dass man das mit SUR bzw. 3SLS lösen könnte.

ad dynamisches panel: äh nein? der arrellano-bond ist ja wohl bitte der standard panel-gmm schätzer für alle fälle wenn das panel breiter als lang ist. dynamisch wollte ich da grds. noch gar nichts machen. das kann man, aber fürs erste reicht random effects wobei die chronologie der spiele vernachlässigt wird.
(das problem ist an sich garantiert dynamisch)

winratio würde ich nicht benutzen weil genau da das matchmaking system mit reinspielt. nimmt man die punktezahlen, hat man mindestens eine schwach exogene größe die im gegensatz zur W/L-ratio nicht verzerrt ist.

childerich, ich kenne deine qualifikation nicht, aber mit "lol" und "schwierig ist nicht immer besser weißt du" sollte man vorsichtig sein. ich habe statistik nicht erfunden, aber ich bin ganz gut darin. also bleib einfach sachlich wenn du meinst einen fehler gefunden zu haben; klugscheißen muss ich nicht haben.

@IMB111: diese abweichungen der siegeswahrscheinlichkeit kann man durch dummies und kreuzterme sehr effizient herausfiltern. bei den fallzahlen die anfallen dürfte man sogar effekte die im mittel im 1%-bereich liegen identifizieren können.

Bowser · 28.09.2010

freeze07 schrieb:
dafür dass er z als so schwach erachtet kommt er aber ganz schön weit in dem tour. hoffentlich gewinnt der das dann gibts ersma keinen buff fürne zergies / nerf für andere rassen.

ach sollen sie nur zerg nerfen, weil cool ein turnier gewinnt. solange p und t verhältnismäßig für ihre turniersiege mitgenerft werden.
gott, was für ein bescheidener vorschlag/aussage.

IMB111 · 28.09.2010

Bootdiskette schrieb:
@IMB111: diese abweichungen der siegeswahrscheinlichkeit kann man durch dummies und kreuzterme sehr effizient herausfiltern. bei den fallzahlen die anfallen dürfte man sogar effekte die im mittel im 1%-bereich liegen identifizieren können.

wenn du es sagst wirds schon so sein
ich habe absolut keine Ahnung von Statistik und beschränke mich deshalb auf meinen gesunden Menschenverstand

das Hauptproblem der ganzen Sache sehe ich eh noch nicht ansatzweise gelöst: wie zum Teufel willst du an die Daten von inzwischen Millionen BNet-Spielen kommen?

Chili · 28.09.2010

Aus der Wikipedia

Der Arellano-Bond-Schätzer (AB-Schätzer) erhöht die Zahl dieser Bedingungen durch die Berücksichtigung verzögerter Levels der abhängigen und prädeterminierten Variablen und Veränderungen der exogenen Variablen auf:

Jo, halt eben dynamisch. Und wenn du auf ein bissel direktes Schreiben nicht klar kommst renn zu deiner mami und erzähl ihr wie fett deine statistik skillz sind. Klar ist doch, dass es schon albern ist wie du hier mit Fach Termini rumschmeißt. Btw, sachliche Gegenargumente stehen oben, aber gerne nochmal: Arelano-Bond = dynamisches Panel.

http://www.jstor.org/pss/2297968

Wenn einer dick rumschwafelt, dabei noch Fehler macht, ärgert mich das einfach.

win/loss als dummy

haste genau die verzerrung durch das mms drinne.

ich meine, du kommunizierst deine forschung auch einfach extrem unglücklick. Bis jetzt haste noch keine verständliche Modellgleichung formuliert. So kann man auch gar nicht Endogenitätsprobleme adressieren, ob Pkte exogen sind...?

"Ich löse das mit Sur oder 3SLS". Nice mag man sich denken. Aber in so em Fall gehörts einfach dazu, die Gleichungen in deiner SUR mal aufzuschreiben. ich habe noch nie mit 3sls gearbeitet, aber ich weiß, dass es eine Art der iv schätzung ist. Über Instrumente haste aber noch nie geredet und ob es überhaupt welche gibt kann man sich schlecht überlegen, solange du noch keine modellgleichungen aufgestellt hast. (Außer das Pkte ein instrument für skill sind, fair enough, aber in welcher regression nun genau?)

Anyways, verstehe mich nicht falsch, ich finds ja cool das du ne statistische Auswertung für sczwo machen willst und würds mir auch reinziehen. Dein Rumgelaber geht mir aber auf den Sack, siehe Kritik oben.

effekte die im mittel im 1%-bereich liegen identifizieren können

Bitte erklären. Ach, wenn ich das schon wieder sehe. Im ganzen Satz wird nicht erklärt, warum es geht. Dummies und Kreuzterme werden nicht definiert. Welcher 1% Bereich? Die 1% der Banane die an Plantagenarbeiter gehen? Oder 1% Signifikanz? uswusw

Bootdiskette · 28.09.2010

IMB111 schrieb:
wenn du es sagst wirds schon so sein
ich habe absolut keine Ahnung von Statistik und beschränke mich deshalb auf meinen gesunden Menschenverstand
das Hauptproblem der ganzen Sache sehe ich eh noch nicht ansatzweise gelöst: wie zum Teufel willst du an die Daten von inzwischen Millionen BNet-Spielen kommen?

Mit gesundem Menschenverstand kommt man schon ganz schön weit, mit Statistik packt man den gesunden Menschenverstand nur noch in Zahlen und kann unter Umständen Kram wie z.b. "zomfg terra is imba!!11einself" nachweisen oder widerlegen

Die Daten kann man bekommen. Auf sc2ranks.com und vergleichbaren Seiten kann man ja pro Spieler zumindest die letzten 25 Spiele nachschauen. Grundsätzlich sind da die ganzen Daten schon vorhanden die man brauch, fast. Man bräuchte die Punkte der Spieler zu jedem Spiel (vor dem Spiel) und eben noch die gespielte Rasse. Die Punkte kann man zurückrechnen, die Rasseninfo ist das Problem, aber evtl. kann man das noch irgendwo rausholen.

Bootdiskette · 28.09.2010

okay, ich kann dir das auch genauer aufschreiben, np. Ich hab's v.a. deshalb nicht gemacht weil ich nicht mit meinen 1337-Statistikskills rumprollen wollte. Man weiß ja nicht wie viele den Kram verstehen den man da so verzapft.

Erstmal Arellano-Bond: Ja, der Schätzer _kann_ dynamische Panels schätzen. Das heißt aber nicht dass man diese Eigenschaft nutzen _muss_. Das ist genau die gleiche Sache wie bei GMM. Mit einem GMM kann man jede beliebige Gleichung schätzen, am häufigsten schätzt man trotzdem Loglinearisierte Modelle mit ihm, weil er eben recht effizient ist und angenehme Eigenschaften hat.

Bei "win/loss als dummy" haben wir aneinander vorbeigeredet. Ich meinte damit nicht die W/L-Ratio, sondern eben auf das jeweilige Spiel bezogen eine 1 für Win und eine 0 für Loss; eine Dummy-Variable halt. Die Variable sollte dann beim Tobit die endogene Var sein.

Die Daten:
Jedes Spiel wird als ein Datensatz dargestellt.

Die Variablen je Datensatz
win = Win/Loss-Dummy, 1 bei Win, 0 bei Loss
mu_zvp = Matchup-Dummy für jedes MU einen. Damit nicht eine Beliebige aufgrund von Endogenität droppt, würde ich das MirrorMU jeweils sinnvollerweise als Basiskategorie definieren und die 3 Rassen in einzelnen Gleichungen schätzen.
pts_self = Eigener Punktestand (vor dem Spiel)
pts_opp = Punktestand des Gegners (vor dem Spiel)
time = Dauer des Spiels
map_lt = Map-Dummy (0,1), auch für alle anderen 1v1-Maps anlegen: map_metal, map_steppes... etc.

Die Schätzgleichung für ein einfaches Tobit wäre dann:

win = b(0)+b(1)*mu_zvp + ... (alle möglichen n mu-vars) ... + b(n+1)*(pts_self-pts_opp) + b(n+2)*(pts_self) + b(n+3)*(pts_opp) + b(n+4)*time + b(n+5)*time^2 + b(n+6)*mu_zvp*time + b(n+7)*mu_zvp*time^2 ... (alle mu-vars als kreuzterme mit der zeit und der zeit im quadrat) ... + (mapdummy+mu_var kreuzterme) + e

Die interpretierbaren Ergebnisse wären:
- Hat das Matchup einen Einfluß auf die Siegeswahrscheinlichkeit (im Vergleich zum MirrorMU gesehen)
- Hat die Dauer eines Spiels einen Einfluss auf die Siegeswahrscheinlichkeit, und ist dieser Einfluss bei verschiedenen MUs unterschiedlich (Sprich: Ist es bei ZvT wichtiger für den Z ins Lategame zu kommen als im ZvP?)?
- Haben Map und MU gemeinsam einen Einfluss auf die Siegeswahrscheinlichkeit?

@ 1% Effekte ... Damit beziehe ich mich auf das Tobit. Die Ergebnisse interpretiert man normalerweise als "Wahrscheinlichkeiten im Mittel". Sprich eine Änderung um 0.01 bei Änderung der Exogenen um 1 wird als "einprozentige Änderung" interpretiert. Bei geringen Fallzahlen werden solche kleinen Effekte typischerweise nicht signifikant, bei den großen Fallzahlen die hier vorliegen, werden eben auch die kleinen Effekte signifikant. Über das Signifikanzniveau habe ich nicht geredet, weil testen auf 1%, 5% und 10% Standard ist, und wegen des gerade beschriebenen Effekts.

Dummyvariable = Eine diskrete Variable die den Wert 0 oder 1 annehmen kann, abhängig davon ob etwas existiert bzw. gegeben ist oder eben nicht.
Kreuzterm = Eine Variable die aus der Multiplikation von 2 anderen Variablen entsteht, und zum Herausfiltern von Verbundeffekten genutzt wird.

Wenn Du Statistik kannst wundert es mich dann doch dass Du Kreuzterme und Dummies nicht kennst. Das "Rumgelaber" schrieb ich auch deswegen weil ich (s.o.) nicht haufenweise Kram schreiben wollte den ohnehin nur 2,2% der Leser verstehen und nur 1,15 interessiert. Wer die Modelle kennt, kann auch aus meinem "Rumgelaber" ziemlich genau erkennen was ich meinte.

Also nichts für ungut, aber: Wenn einer dick rumschwafelt und mir Fehler ankreidet weil er's selbst nicht checkt nervt einfach :ugly:

Sorry, der musste einfach sein. Back 2 Sache, k?

Chobocco · 28.09.2010

Bootdiskette schrieb:
...

und welche deiner Variablen bietet interpretierbare ergebnisse über den von IMB11 geschilderten Fall?

wenn Zerg zu 60% gegen T und Toss verliert, werden durch mms die Siege trotzdem auf 50% genormt und deine Formel failt. Oder?

Bootdiskette · 28.09.2010

Das MMS spielt da gar nicht rein.
In der oben beschriebenen Schätzung mit 3 Einzelgleichungen könnte man an den Variablen rechts des "=", und die "mu_X" enthalten, ablesen ob das Matchup X im Vergleich zum Mirror eine unterschiedliche Siegeswahrscheinlichkeit aufweist.

D.h. wir haben z.B. einen Datensatz mit 1000 Spielen die bspw. ein Protoss gemacht hat. Alle Variablen in denen das Matchup vorkommt hätten dann diese Interpretation: Sind sie positiv und signifikant von 0 verschieden, hat dieses MU einen positiven Einfluss auf die Siegeswahrscheinlichkeit.
Hat z.b. der Kreuzterm time*mu_pvz ein negatives Vorzeichen (und ist signifikant), bedeutet das, dass der Protoss in einem PvZ umso schlechtere Siegesaussichten hat, je länger das Spiel dauert; die Zeit arbeitet gewissermaßen für den Zerg.
Eigentlich ist es aber nicht die Zeit, sondern die Annahme dass mit längerer Spieldauer auch höhere Tech zum Einsatz kommt. Die Zeit ist also eine Instrumentvariable (sprich: Krücke) dafür, dass man keine detaillierteren Daten hat.

Das MMS hat dann einen Einfluss auf die Schätzungen, wenn man die Win/Loss-Ratio mit einbaut. Das wäre bei einer großen Masse an Beobachtungen irgendwann auch möglich und sogar sinnvoll. Man müsste "nur" das Modell ändern und deutlich detailliertere Daten haben --> Simultaneous Equations Model ftw! (http://en.wikipedia.org/wiki/3SLS)

Chili · 28.09.2010

Jo, wäre interessant, sehr sogar. Nicht sehr zufrieden bin ich damit, drei Schätzungen mit drei Sets von Dummies durchzuführen. Aber gut, man kann viele verschiedene Spezifikationen testen und sich dann immernoch entscheiden.

Die interpretierbaren Ergebnisse wären:
- Hat das Matchup einen Einfluß auf die Siegeswahrscheinlichkeit (im Vergleich zum MirrorMU gesehen)
- Hat die Dauer eines Spiels einen Einfluss auf die Siegeswahrscheinlichkeit, und ist dieser Einfluss bei verschiedenen MUs unterschiedlich (Sprich: Ist es bei ZvT wichtiger für den Z ins Lategame zu kommen als im ZvP?)?
- Haben Map und MU gemeinsam einen Einfluss auf die Siegeswahrscheinlichkeit?

Würden mich jeweils auch deskriptive Statistiken zu interessieren. Punkt 2 z.B. aufgeschlüsselt in "Spiel kürzer als 5 Min", ...., "Spiel länger als 20 Min". Aus methodologischen Gründen lege ich auf jene viel Wert, üblich sind sie zumindestens mit einleitenden Charakter.

Die Daten: Jedes Spiel wird als ein Datensatz dargestellt.

Je nachdem wie die Daten erhoben werden darauf achten, dass das Gegenstück zu einem Spiel rausgenommen wird. Wenn Spieler A gegen Spieler B winnt, darf das nicht als Win für A und Loss für B im Datensatz stehen, sonst sind deine Störterme nicht IID.

Weiß gar nicht, wie du auf Panel kamst, aber bisher ist das eine Cross Section zu der Individuen mehrmals beitragen, anders formuliert, du benutzt keine der Panel Eigenschaften, es sei denn versteckt im Schätzer.

Bei "win/loss als dummy" haben wir aneinander vorbeigeredet. Ich meinte damit nicht die W/L-Ratio, sondern eben auf das jeweilige Spiel bezogen eine 1 für Win und eine 0 für Loss; eine Dummy-Variable halt. Die Variable sollte dann beim Tobit die endogene Var sein.

JoJo, das MMS spielt aber natürlich auch hier rein. Du wirst ja keine globalen Effekte ala "T hat eine höhere Siegwahrscheinlichkeit" finden, sondern allerhöchstens "Z hat gegen T eine kleinere Siegwahrs. als gegen P". Insbesondere taugt diese statistische Auswertung keinesfalls um Aussagen ala "T ist nicht op" zu treffen.

Sehr interessant, nun musst du nur noch die Daten erheben :deliver:

Chobocco · 28.09.2010

Bootdiskette schrieb:
..

hmmm irgendwie überzeugt mich das nicht. MMS sorgt doch gerade dafür, dass du gegen jeden Gegner eine 50% winchance hast. d.h. wenn mms funktioniert, wovon ich einfach mal ausgehe, dann ist der Einfluss deiner Variablen "mu_X" im modell 0, obwohl es in wahrheit ein wert verschieden von null ist.

Ich glaube was du nicht bedenkst, ist dass im falle von imbalance ein guter zerg gegen schlechtere T und P spieler spielt. Ohne "skill" variable kannst du doch garnicht gucken ob das matchup eine rolle spielt, weil es eben auf 50:50 genormt wird. und ne skill variable kann man nicht erheben. auch punkte ist kein ersatz dafür.

beispiel:
Z spieler mit variable "skill" von 0.8 spielt gegen 100 toss spieler mit "skill" 0.6 und gewinnt 50%
-> das match ist imba, zerg is besser, gewinnt trotzdem nur 50% gegen schlechtere toss

jetzt verdeck die variable skill. alles was du siehst ist dass z zu 50% gegen P gewinnt
-> match ist nicht imba

das ist mms und ich sehe nicht wie du so einen fall erkennen willst/kannst

Bootdiskette · 29.09.2010

Childerich schrieb:
Je nachdem wie die Daten erhoben werden darauf achten, dass das Gegenstück zu einem Spiel rausgenommen wird. Wenn Spieler A gegen Spieler B winnt, darf das nicht als Win für A und Loss für B im Datensatz stehen, sonst sind deine Störterme nicht IID.

Das ist der Grund warum das im Endeffekt mit SUR bzw. 3SLS geschätzt werden sollte. Dadurch korrigiert man genau den von dir angesprochenen Effekt.

Childerich schrieb:
Weiß gar nicht, wie du auf Panel kamst, aber bisher ist das eine Cross Section zu der Individuen mehrmals beitragen, anders formuliert, du benutzt keine der Panel Eigenschaften, es sei denn versteckt im Schätzer.

Jo, stimmt. Panel war mein erster Gedanke, aber beim Durchdenken neben dem Lernen für was ganz anderes hab ich das dann nicht weiter vertieft. Ist natürlich noch ne Menge Potential drin, das mit einer Tobit Random Effects Sache durchzunudeln.

Childerich schrieb:
JoJo, das MMS spielt aber natürlich auch hier rein. Du wirst ja keine globalen Effekte ala "T hat eine höhere Siegwahrscheinlichkeit" finden, sondern allerhöchstens "Z hat gegen T eine kleinere Siegwahrs. als gegen P". Insbesondere taugt diese statistische Auswertung keinesfalls um Aussagen ala "T ist nicht op" zu treffen.

Jein. Das MMS spielt auch rein, ja. Aber solange man einzelne MUs anschaut, wird man schon Unterschiede feststellen können. Je nach Detailgrad der Informationen könnte man dann durchaus doch auf Imbaness schließen. Natürlich wird man nirgendwo die versteckte Aussage finden, dass T > Z, aber Anhaltspunkte werden sich finden lassen, ganz bestimmt. Die ganzen Beschwerden von Z-Spielern kommen ja auch nicht von ungefähr. Mit Statistik dürfte sich deren Ursache wenn nicht finden, dann zumindest eingrenzen lassen.

Childerich schrieb:
Sehr interessant, nun musst du nur noch die Daten erheben

Du wirst lachen, ich habe vorhin beim Champions League gucken mit einem Kumpel gesprochen der mit Zocken rein gar nix (außer PES und FIFA) am Hut hat. Der meinte "Geile Idee, mach doch!". D.h. ich werde zumindest mal eine Anfrage an Blizzard schicken ob sie grundsätzlich anonymisierte Daten weitergeben würden, bzw. bereit wären zu helfen - meinetwegen auch mit einem Non Disclosure Agreement für eventuelle Geschäftsgeheimnisse.
Mein bisher geplantes Diplomarbeitsthema wäre in die Richtung "Einfluß der EU-Erweiterung auf Multinationals in den CEECs" gegangen. Wissenschaftlich verpackt hieße "Is Terra imba?" --> "Simultanes Wettbewerbsverhalten unter Unsicherheit in 1-gegen-1-Situationen - Untersuchungen anhand von Computerspieldaten" :ugly:

Die Zerg-Sache stünde da nicht mehr unbedingt im Zentrum. Die Tatsache dass man einen Datensatz mit sehr validen Daten und festen Experimentalbedingungen haben könnte wäre der Hammer überhaupt. So ein Datensatz kostet normalerweise extrem viel Zeit und Geduld im PC-Labor.

@Chobocco: Jein. Du hast intuitiv nicht unrecht. Das Problem ist aber dass das MMS die Wahrscheinlichkeit anhand einer uns unbekannten Formel (oder Algorithmus) im Vorhinein einschätzen muss. Wir dagegen bekommen die Daten die während des Spiels und im Nachhinein erhoben werden. D.h. wir haben einen Wissensvorsprung gegenüber dem System.
Wenn ein guter Zerg immer gegen schlechtere T und P spielt, weil T und P OP sind, während Zerg jämmerlich UP ist --> Kein Problem. Die Struktur würde man auch sehen. Im Mittel müsste dann der Zerg mit 1000 Pkt. gegen T und P mit weniger als 1000 Pkt spielen. Während die Z-Gegner für T und P tendenziell immer höhere Punktezahlen hätten.
(Ich nehme hier die Punkte, weil sie ohne größeres Nachdenken die beste Krücke für "Skill" sind, die wir haben)
D.h. dein Einwand ist absolut berechtigt, denn die versteckten Effekte des MMS müssen korrigiert werden, bzw. man muss zumindest wissen oder ahnen wie das MMS Einfluß nimmt. Es ist jedoch nicht so, dass man nicht die feinen Unterschiede herausfinden könnte, die dann gemeinsam oder einzeln Hinweise darauf geben, welche Faktoren auf den Ausgang eines Spiels wirken, und welche Faktoren wichtiger sind als andere.

Ein mögliches Ergebnis wäre z.b. auch, dass das die Gegnerrace für T total wichtig ist, weil T gg. Z total gut abschneidet, dass aber Z wiederum selbst total von den Maps abhängig ist. Kann man im Vorfeld nur drüber spekulieren.
Lösbar sind die Probleme aber definitiv alle.

Dekker · 29.09.2010

Dachte das passt hier halbwegs zur Diskussion. Netter Thread auf TL.net mit folgender interessanten Antwort von Morrow:

when did i trash talk?
nice hate thread right here

im not playing zerg to back up my words, im playing zerg to find out if its any more fun than terran is, or any harder whatever. its starting to get boring in the long run to play sc2 terarn because its 10 times easier than sc1. i want challange and esport but sc2 is not hard at all. i play toss some games and won vs top level terrans and not even knowing hotkeys ...
i just wish they made terran and protoss harder to play

zerg was so difficult to play on mechanics than terran was, which makes me really tempted to switch

i dont even know zerg hotkeys or early game bo would u expect me to lose vs any diamond on 2000 ladder pts area? xD

im not trying to prove anything, why would this prove anything anyway lol. im just testing stuff out to see if the grass is greener ...

Deleted_504925 · 29.09.2010

Dekker schrieb:
Dachte das passt hier halbwegs zur Diskussion. Netter Thread auf TL.net

konnte mir das lachen nicht verkneifen als ich die stats gesehen hab, aber mutig das mit seinem mainacc zu machen und direkt ladder zu spielen, ist von über 2100 auf 1600-1700 gefallen,
aber im 2000 punkte diamond auf ne race zu switchen die man vorher offensichtlich noch nie gespielt hat würde wahrscheinlich jeder erstmal auf die nuss bekommen.

sOui · 29.09.2010

von 2020 auf 1800 btw. - man muss ja nicht übertreiben

Deleted_504925 · 29.09.2010

sOui schrieb:
von 2020 auf 1800 btw. - man muss ja nicht übertreiben

bin von dem bild im thread ausgegangen, sieht nach 1600 aus

sOui · 29.09.2010

dürfte nicht ganz stimmen, da in europe noch keiner ueber 2050 war - morrow war mit 2040 meine ich piek. und gedroppt ist er auch nicht unter 1600 so wie in dem graphen.

aber eigentl. ja auch egal

Cool erwägt Raceswitch für GSL2

aNjIrU

Guest

Deleted_504925

Guest

Deleted_504925

Guest