kann i dir leider nit weiterhelfen habs selber nicht gewusst und halt irgendwas gerechnet:DZitat:
Zitat von galatagirl
Druckbare Version
kann i dir leider nit weiterhelfen habs selber nicht gewusst und halt irgendwas gerechnet:DZitat:
Zitat von galatagirl
:D alles klar, trotzdem danke...Zitat:
Zitat von hippie
schau mal bei den letzten online-Tests nach... ich glaub, dass war im letzten oder vorletzen online-Test ein thema... lgZitat:
Zitat von galatagirl
ja da hat man erwartungswert rechnen müssen. Das geht ja, aber i weiß nid was mit verteilung gemeint ist...Zitat:
Zitat von jublu1984
so leute, für alle die noch net so wirklich wissen, was sie lernen sollen hier eine zusammenfassung vom jublu1984 (natürlich ohne gewähr ;) )
Statistik:
1. Aufgabe zu den stetigen Zufallsvariablen
2. Regressionsanalyse mit Stata
Regressionsanalyse:
- Skalenniveau bestimmen
- Korrelationskoeffizient (positiver oder negativer linearer zusammenhang)
- Regression
- R2 definieren
- Regressionsgleichung anschreiben
- Parameter interpretieren
- Prognosen (Preis)
- Schätzer verzerrt?
- Informationskriterien (AIC vergleichen)
- Dummy-Codierung
wenn man das alles kann, sollte sich locker eine positve Klausurnote ausgehen! :)
HAB NOCH WAS VERGESSEN !!! :-D im tutorium zur 3. ps klausur statistik wurde allen nahe gelegt, sich die schreibwese (händisch) anzusehen -> vgl. Foliensatz 6, seite 20 (nur so als Bsp. ;) )
wie macht ihr die a)?
mit scatter, graph box oder einfach mit regress?
LG Stefan
ich würde sie mit scatter machen... leider ist der datensatz nicht mehr verfügbar... jedoch wenn man logisch an die sache ran geht, dann ist klar dass mit steigender ladung, die kosten (bezin, abnutzung, etc.) auch steigen. :arrow: müßte also eine steigende gerade ergeben ;) - is zumindest meine interpretationZitat:
Zitat von csak4390
danke!Zitat:
Zitat von jublu1984
mit welchen Befehlen hast du den die d) glöst? ist mit modell einfach das regressionsmodell gemeint?
d) modell zwischen- kosten, ladung und reifendruck......und begründen sie warum das modell so aussieht
LG Stefan
mhh gute frage... also erstens schreib ich erst am mittwoch und zweitens, glaube ich dass du das mit dem befehl scatter variable1 variable2 || variable 3 variable4 lösen kannst (musst)... allerdings sind das alles nur vermutungen !!! die ich anhand der gegebenen angaben mach. ohne konkrete angaben ist das leider genauer nicht möglich...Zitat:
Zitat von csak4390
so ich bin jetzt was essen und schätzungsweise gegen 20 uhr wider online für fragen/beschwerden/anregungen und co :-D
BITTE BITTE stellt jemand die angaben (aufgaben) von der prüfung, die heute nachmittag war, online?!
wieder online 19:18
also ich kann jetzt nur von meiner gruppe berichten (stöckl 13:00)
es ging ums thema briefe .. wie viele ausgeliefert werden in welche bezirke und wieviele privatadressen briefe bekommen und so zeug außerdem waren die wochentage als dummys so kodieren (zb. montag "starker" tag, di "schwacher" tag..)
man muss eigentlich so ziemlich das gleiche machen wie beim aufgabenblatt 5 .. also mit scatter zeichnen und dann regress und halt alles beschreiben ..
außerdem war noch eine kurze rechnung .. man musste 1x den erwartungswert berechnen und 2x die varianz .. war total einfach - man musste nur die zahlen richtig für x einsetzen..
leider kann ich euch die genauen stata befehle geben da in unserer gruppe die falschen daten hochgeladen waren .. wir hatten also "unsere" angabe .. mussten aber mit den werten von den vormittagsgruppen rechnen .. war ein wenig chaotisch :P
schaut euch einfach das 5er üb gut an ! dann sollte der größte teil geschafft sein :)
Zitat:
Zitat von girasol
wieviel ausprägungen gab es bei den wochentagen? 3? wie kodier ich das für die ganze woche?
Zitat:
Zitat von girasol
erst einmal VIELEN DANK :!::!::!: trotzdem die frage, kannst du dich vielleicht ein kleinwenig genauer an die Aufgaben dran erinnern? wir haben nämlich die datensätze und das würde uns SEHR weiterhelfen ;)
dadürch, dass es "nur" die möglichkeiten von 1 bis 3 gibt, würde ich sagen, dass das ähnlich st wie mit mietbeispiel aus foliensatz 6 > normale, gute oder sehr gute lage. alles dreis als dummy codieren, wobei dann eine variable nicht beachtet wird... :)Zitat:
Zitat von JuliaM.
ach ja, wenn ich du währe würd ich schauen, ob's die datensätze noch im e-campus gibt... ;) so zum üben und so
ja das hab ich eh schon ;) also dann würde man zb die starken tage als Referenzkategorie nehmen und dann die schwachen und mittleren tag als dummy codieren oder?Zitat:
Zitat von jublu1984
was meinst du ist die fixe variable von der die anderen abhängig sind? anzpost??
ihr habts die datensätze?
also bei aufgabe a musste man ein scatter diagramm zeichnen
"scatter kosten ladung || lfit kosten ladung"
dann interpretierst die zeichnung
b war dann "regress kosten ladung" und "regress kosten druck" und interpretieren
c war "regress kosten ladung druck" und (ihr könnt es euch schon denken ) interpretieren ..
d war die dummy variable erzeugen .. weil wir ja den datensatz - spritpreis hieß er glaub ich - haten mussten wir 3 typen in klein mittel und groß einteilen ..
also gen typklein = 1*(typ==1)
gen typmittel = 1*(typ==2)
und gen typgroß = 1*(typ==3)
e war dann "regress kosten ladung druck typklein typmittel typgroß"
und interpretieren
und f war eine prognose zu erstellen ..
also keine große hexerei...
ja, haben wir... sind im ecampus zu finden... die tun die net raus... :DZitat:
Zitat von girasol
hmm... allerdings habn wir den datensatz zu den briefen... das bringt uns also nix... trotzdem danke!:danke:
ah ok.. schad dass ich nicht weiter helfen kann ..
aber ihr werdets das sicher schaffen :)
hmm gute frage... :D ich würde sagen wotag, weil ich mal davon ausgehen würde, dass je nach wochentag sich die anzahl der post, die die betriebe bekommen bzw. der privathaushalt ändert... also mo und di zum beispiel viel und am wochenende gar nichts... :) und was die sache mit dem referenzkategorie angeht: soweit ich das bsp. aus foliensatz 6 richtig verstanden hab, ist es egal welche man als referenzkategorie bestimmt, da immer das selbe ergebnis (also mit den anderen 2 variablen) heraus kommt, oder nicht?!Zitat:
Zitat von JuliaM.
ja ja welche man als referenzkategorie nimmt ist ja wurscht!Zitat:
Zitat von jublu1984
aber meinst du echt wotag? weil wenn man am anfang die scatter und die normalen reg macht dann ist das mit dem wotag doch unlogisch!? außerdem könnte man wenn es um die anzpost geht die unterschiede wieviel post zu privhaushalten und wieviel zu betrieben geht besser erkennen oder?
reden wir viell grad aneinander vorbei?? :oops:
wie würdest du die codierung machen?? anhand unseres datensatzes: schwache, mittlere starke tage??
wann schreibst du eigentlich? @ juliaM?
morgen um eins, du??Zitat:
Zitat von jublu1984
mittwoch 11:30... kleiner tipp, schau morgen vormittag in den e-campus... vermutlich ist der prüfungsdatensatz für da schon online. ach ja, wenn du natürlich die angaben dazu posten könntest ... nun ja, dann wärst die beste ;)Zitat:
Zitat von JuliaM.
Zitat:
Zitat von jublu1984
könntest du mir viell noch sagen wie du das codieren würdest anhand des datensatzes den wir grad haben`?? :)
Zitat:
Zitat von JuliaM.
sorry, wie meinst das jetzt mit dem codieren? dummie erstellung oder was? :)
genau :)Zitat:
Zitat von jublu1984
dazu würde ich dich auf die E-Mail von Prof. Lang verweisen >Zitat:
Zitat von JuliaM.
"Wir haben eine kategoriale Variable x mit den 3 Kategorien
1, 3 und 6. Wir wollen daraus 2 dummy kodierte Variablen
erzeugen, die ins Regressionsmodell aufgenommen werden
können. Als Referenzkategorie wählen wir die Kategorie
3. Dann geht das in Stata so:
generate x1 = 1*(x==1)
generate x6 = 1*(x==6)
Mit x1 und x6 dann ins Regressionsmodell."
statt 1,3 und 6 nimmst halt schwacher, mittlerer und starker tag ;)
außerdem dürfte dir das hier weiter helfen > http://www.sowi-forum.com/forum/show...t=23801&page=3 ... dort gehts um aufhgabenblatt 5; also auch um die erzeugung von dummys :)
ich hoffe, ich hab die frage damit beantwortet ;)
Zitat:
Zitat von jublu1984
ja das versteh ich schon, dachte nur man muss da was anders machen wobei man die wochentage noch mit einbezieht aber so :)
was denkst du jetzt aber welche variable die fixe ist so wie im aufgabenplatt 5 der preis?? anzpost??
siehe oben: wotag, weil sich nach dem ja richtet wieviel post versendet wird (wochenende zB nichts, mo vielleicht viel wochenmitte normal, ...) :)Zitat:
Zitat von JuliaM.
ja aber ich kann doch keine kategoriale variable als fixpunkt nehmen so wie preis! es muss eine stetige sein!!!Zitat:
Zitat von jublu1984
für dummy codierung schon wotag aber
reg wotag anzpost privhaus betriebe
ergibt keinen sinn!?!?!
sorry, da haben wir aneinander vorbei geredet ... hast natürlich recht. ich dachte, du meinst die dummys ( >>> jublu1984 anscheint selbst ein dummi ;) ) für reg natürlich anzpost... :)Zitat:
Zitat von JuliaM.
guten moooooooooorgen!
kann jemand von euch die angabe von der ps-prüfung (die von heute morgen) hier posten?! DANKE :D
Zitat:
Zitat von jublu1984
morgen
du ich hab da mal ne ziemlich komische frage aber irngedwie geistert mir die so im kopf rum:
wohin haben wir in den vergangen klausuren die daten und graphen gespeichert!?
cd i:\ und dann?
use Speicherort??\.....dta
kann mir bei den 2 fragen vllt jemand weiterhelfen...:
1. Bei der berchnung des korrelationskoeffizienten, welche variable muss man zuerst eingeben, die abhängige oder die unabhängige?
2. Wie lässt sich der AIC berechnen und wie ist er zu interpretieren?
Zitat:
Zitat von JuliaM.
soweit ich weiß, müssen graphen net angespeichert werden... :) was die sache mit dem do-file angeht, müßte der befehl: save daten\gewünschtename.dta
:)
und wohin muss ich die Daten speichern? oder kann ich die direkt mit stata aufrufen!?!?Zitat:
Zitat von jublu1984
kann mir bei den 2 fragen vllt jemand weiterhelfen...:
1. Bei der berchnung des korrelationskoeffizienten, welche variable muss man zuerst eingeben, die abhängige oder die unabhängige?
2. Wie lässt sich der AIC berechnen und wie ist er zu interpretieren?
JUBLU DU WEISST DAS DOCH BESTIMMT!!!!! :-)
bei corr musst du zuerst die fixe variable und dann die erklärende variable eingebenZitat:
Zitat von ludwig760
und bezüglich des AIC: befehl estat ic dann ist der AIC Wert wichtig. je kleiner der wert desto besser das Modell :)
heyZitat:
Zitat von ludwig760
1) würd sagen zuerst die abhängige und dann die unabhängige, aber isch es beim cor befehl nit so....egal ob mans verkehrt eingibt kommt das gleiche raus oder ist das ein anderer
2) mit estat ic im stata......AIC gibt besser/genauer auskunft als R²:D
vielen dank an beide!:D
bei dem dummybeispiel vom lang:
Wir haben eine kategoriale Variable x mit den 3 Kategorien
1, 3 und 6. Wir wollen daraus 2 dummy kodierte Variablen
erzeugen, die ins Regressionsmodell aufgenommen werden
können. Als Referenzkategorie wählen wir die Kategorie
3. Dann geht das in Stata so:
generate x1 = 1*(x==1)
generate x6 = 1*(x==6)
Mit x1 und x6 dann ins Regressionsmodell.
Wieso generiert er die referenzkategorie nicht?
@ jublu:
wenn ich jetzt den Datensatz aus ecampus abspeicher (den ort bekommen wir ja vorgegeben) wie les ich den dann ein? ich bin irgendwie grad voll verwirrt :roll:
schreib ich dann einfach use daten\....dta
oder muss ich es wie bei den ps stunden mit:
cd i:\....
use Daten\....dta
HILFE
take it easy ;) also, du speicherst den ganzen spaß (also das do-file) ab... am besten auf dem desktop. die sache mit dem save daten ... ist nur interessant, wenns im do-file stehen muss, ansonsten kannst du das auch händisch über save as... machen. :) dann öffnest du den e-campus, statistische datenanalyse, Übungen und dann auf durchsuchen und datei auf dem desktop auswählen > hochladenZitat:
Zitat von JuliaM.
etwas logischer? ;)
Zitat:
Zitat von ludwig760
wie ich sehe, wurde ihnen schon geholfen ;) stimmt, was die anderen "gesagt" haben! :)
ja ja das mit dem dofile weiss ich schon aber wie ich den datensatz in stata einles oder speicher!?! kann ich das einfach direkt über ecampus öffnen mit stata machen?Zitat:
Zitat von jublu1984
hier der datensatz von der klausur, wenn wer mit ihm schon üben will ;=)
abbadon.at/uni/spritverbrauch.dta
Kann mir jemand sagen, wie groß der AIC maximal sein kann (ich nehme an 1 oder?) und wie man die Verzerrung ausrechnen kann?
Muss man nach dem STATA Befehl estat ic auch noch die Variablen eingeben?
Danke im Voraus
so ich habe die klausur gerade geschrieben. also wir hatten einen datensatz in dem es um Skirennen ging; es gab folgende 4 tabellen: weltcuppunkte (punkte), trockentrainingsstunden (tt), stangentrainingstunde (st) und die nationalität (1=deutschland,2=österreich und 3 = anderes).
1. Anhand von Tabellen die stetigen Variabeln beschreiben
2. lineare Regressionsanalyse
3. multiple Regressionsanalyse
4. Dummyvariabeln für Nationalität erstellen
5. stimmt es dass ein österreichischer skifahrer im schnitt schneller ist als ein deutscher und wenn ja um wie viel?
6. Prognose: österreichischer skifahrer der 1200 trockentrainingsstunden hat und 25 stangentrainingsstunden
7. Rendite berrechnen ==> N(1,2) für x<3 und x=0.5
Das müsste alles gewesen sein. Würde sagen wer das Aufgabenblatt 5 gut vorbereitet schafft die Klausur. :)
LG Stefan
Kannst du vl erklären, wie du 7. berechnet hast? Komm da nicht ganz mit...Zitat:
Zitat von csak4390
ich glaub da war die rendite zu berechnen, kann mich aber nicht mehr so genau erinnern! :)Zitat:
Zitat von Tiny88
LG Stefan
und wie hast du das gemacht? rechenweg? kannst du dich erinnern?Zitat:
Zitat von csak4390
aja, "Anhand von Tabellen die stetigen Variabeln beschreiben"... mit tabellen? also nichts mit zb scatter miete st?
danke im voraus :)