Statistica 8 — Desktop-Linie
Feature Liste | Neue Features | System Requirements | Weitere Informationen
In die Version 8 der Produktlinie STATISTICA sind über 20 Jahre Erfahrung in der statistischen und grafischen Datenanalyse eingeflossen. Auf dieser Seite finden Sie aktuelle Informationen zu den neuen Features der Version 8, von denen sowohl Nutzer von Einzelplatzlizenzen, als auch die Unternehmenslösungen profitieren.
STATISTICA Basis (vorher Standard) liefert einen umfassenden Satz grundlegender Statistiken in einem bedienerfreundlichen Paket, das die Leistungsfähigkeit, Kraft und leichte Bedienbarkeit der STATISTICA-Technologie bietet. Aufbauend auf dem Basismodul STATISTICA Basis bieten wir Zusatzmodule mit vertiefenden statistischen Verfahren und speziellen Grafiken. Allen diesen Modulen gemein ist die Leistungsfähigkeit und leichte Bedienbarkeit der STATISTICA-Technologie.
|
 Produktstruktur STATISTICA Desktop-Linie
|
Neu in STATISTICA 8
STATISTICA Desktop
Professionell
Industrie
Spezialprodukte
|
|
|
|
|
STATISTICA stellt Ihnen viele neue, einzigartige Funktionen in der gesamten STATISTICA-Produktfamilie zur Verfügung.
|
- Allgemeine Funktionen
- Projekte. Sie können jetzt STATISTICA-Projekte abspeichern, die den gegenwärtigen Zustand der aktuellen Arbeitssitzung abbilden, einschließlich der Fensterposition auf dem Bildschirm. Öffnet man die Projektdatei wieder, kann die Analyse genau an der Stelle wieder aufgenommen werden, wo sie abgespeichert wurde. Optionen zur Speicherung des mit der Analyse aufgezeichneten Analyse-Makros werden ebenfalls angeboten.
- Analyse fortsetzen / Analyse wiederholen. Analysen können aus einer Arbeitsmappe heraus wieder aufgenommen oder vollständig neu berechnet werden, auch auf der Basis eines neuen Datenbestandes. Damit lässt sich eine Analyse bequem dort wieder aufnehmen, wo sie vorher unterbrochen wurde, oder vollständig neu mit anderen Daten wiederholen.
- QuickInfo-Erweiterungen
- QuickInfos zeigen den vollständigen Text von Tabellenzellen.
- QuickInfos zeigen den numerischen Wert eines Textwertes.
- Umbruch bei Variablennamen. Variablennamen werden in der Ansicht innerhalb des Wortes umgebrochen.
- Unterstützung mehrerer Versionen. Mehrere lizenzierte Versionen von STATISTICA (einschließlich unterschiedlicher Sprachversionen) können gleichzeitig auf einem Rechner installiert und genutzt werden.
- 64-Bit-Unterstützung. STATISTICA kann auf 64-Bit-Betriebssystemen von Windows installiert werden.
- Hintergrund des Anwendungsfensters. Man kann zwischen verschiedenen Hintergrundstilen wählen oder ein beliebiges Bild verwenden.
- Microsoft Office Integration
- Microsoft Excel-Dokumente lassen sich direkt in STATISTICA öffnen, ohne dass sie in das STATISTICA-Dateiformat importiert werden müssen.
- Microsoft Word-Dokumente können direkt als Typ des Ausgabeberichts verwendet werden.
- Grafiken können über Ziehen-und-Ablegen in STATISTICA-Dokumente oder externe Dokumente wie von Microsoft Word oder PowerPoint eingefügt werden.
- Statistik
- Zusammenfassende Ergebnisaugaben. An geeigneten Stellen werden zusammenfassende Ergebnisausgaben angeboten, die Grafiken und Statistiken kombinieren.
- Deskriptive und robuste Statistiken, nicht-faktorielle Gliederungen und Tabellen. Neue Statistiken wie Winsorisiertes Mittel, Getrimmtes Mittel, Grubbs-Test für Ausreißer, Variationskoeffizient, Konfidenzintervalle für Stichprobenstandardabweichungen und Prozent gültiger Beobachtungen wurden hinzugefügt. Weitere Tests sind auch noch im Abschnitt Daten bereinigen und filtern weiter unten beschrieben.
- T-Test, unabhängige Stichproben, Gruppen. Konfidenzintervalle der Schätzungen sind jetzt verfügbar.
- Korrelationsmatrizen. Mittelwerte und Standardabweichungen können jetzt der quadratischen Korrelationsmatrix hinzugefügt werden.
- Box-Cox-Transformation. Optionen zur Berechnung von Box-Cox-Transformation wurden hinzugefügt, einschließlich der Ausgabe von Statistiken, Histogrammen und Normalverteilungsplots. Die Ergebnisse lassen sich in die Eingabedatei zurückschreiben.
- Botched-Designs. In zweistufigen Plänen, Screening- und anderen Plänen werden Versuche unterstützt, die so genannte "Botched"-runs enthalten (d.h. Faktoren können nicht exakt auf die spezifizierten Niveaus gesetzt werden).
- Optimale Split-Plots. Optimale Split-Plot-Designs können generiert und analysiert werden.
- Nichtparametrische Verfahren. Die maximale Fallzahl für nichtparametrische Verfahren wurde auf eine Million erhöht.
- Multivariate Qualitätsregelkarten. Folgende Funktionen werden unterstützt:
- Hotelling T-Quadrat-Karte
- Multiple Stream-Karten
- Multivariate Exponentielle gleitende Durchschnittskarten (MEWMA)
- Multivariate kumulative Summenkarten (MCUSUM)
- Verallgemeinerte Karten für Varianzen
- Attributive Analyse der Prüferübereinstimmung. Die Kennziffern Fleiss' Kappa, Cohen's Kappa, Kendall's Konkordanz-Koeffizient und Kendall's Korrelationskoeffizient werden berechnet. Die Prüfübereinstimmung nach Prüfer oder Teil mit zugehörigen Konfidenzintervallen werden auch in grafischer Form dargestellt. Eine Tabelle zur Beurteilung der Nicht-Übereinstimmung (die zeigt, inwieweit ein Prüfer nicht mit dem Standard übereinstimmt) bei binärem Attribut und bekanntem Standard ist ebenfalls verfügbar.
- Attributive Messsystemanalyse. Die Ergebnisse dieser Analyse schließen eine zusammenfassende Übersicht, Grafiken und Kennziffern ein, die im AIAG-Handbuch zur Messsystemanalyse beschrieben werden.
- Fähigkeitskennziffern für Positionstoleranz. Diese Methode bewertet Koordinatenpaare im Vergleich zum "wahren Wert" eines zentralen Punktes. Die Ausgabe beinhaltet Fähigkeitsgrößen und Scatterplots aller X/Y-Variablenpaare mit Kreisen und Linien, die das spezifizierte Toleranzgebiet markieren.
- Analyse der Messmittelfähigkeit. Die Variabilität von Messmitteln wird mit den Spezifikationsgrenzen der Teile verglichen.
- Qualitätsfähigkeitskenngrößen nach ISO/DIN (Verteilungszeitmodelle). Diese Verfahren erlauben die Berechnung von Qualitätsfähigkeitskenngrößen nach den Vorgaben der DIN 55319 (siehe Deutsches Institut für Normung e.V., 2002) und der ISO 21747 (siehe ISO, 2006). Sie können verwendet werden, wenn aus einem laufenden Herstellungsprozess aufeinander folgende Stichproben mit Beobachtungen entnommen werden, mit dem Ziel, Fähigkeitskenngrößen in Bezug auf eine oder mehrere gemessene Qualitätsmerkmale zu schätzen. In diesen Standards werden verschiedene Verteilungsmodelle definiert, die beschreiben, 1) wie die Beobachtungen innerhalb jeder Stichprobe verteilt sein können, 2) wie die Momente (z.B. Lage und Streuung) aufeinander folgender Stichproben über die Zeit verteilt sein können (z.B. normal oder nicht-normal) und 3) wie die Fähigkeit basierend auf der resultierenden Verteilung (bei gegebener Verteilung der Beobachtungen innerhalb der Stichprobe und über die Stichproben/Zeit) am besten geschätzt wird.
- Statistiken für Blockdaten. Die Ergebnisse der Statistiken für Blockdaten werden nun in eigenen Ergebnistabellen ausgegeben.
- Grafik
- Bag-Plot. Dieser spezielle Scatterplot stellt eine bivariate Verallgemeinerung von Tukey's univariatem Box-Whisker-Plot dar und dient der Identifikation von Verteilungen (und Ausreißern) im zweidimensionalen Raum.
- Bi-Plot. Dies ist eine Grafik in der Multivariaten Prozessüberwachung (MSPC), mit der Beziehungen zwischen eingegangenen Variablen und extrahierten Faktoren untersucht werden, um die Ursachenanalyse effektiv zu unterstützen.
- Wafer-Plots. Diese spezielle grafische Methode wird üblicherweise in der Halbleiter-Industrie eingesetzt, um Daten zu Defekten auf zweidimensionalen Ebenen (Halbleiterscheiben) abzubilden.
- Überlagerte Konturenplots. Dieser spezielle Konturenplot identifiziert "gemeinsame Regionen", in denen die Anforderungen mehrerer Wertebereiche an Z gemeinsam erfüllt werden.
- Überlagerte Normalverteilungsplots. Normalverteilungsplots (einschließlich Quantil-Quantil-Plots und Probability-Probability-Plots) können mehrere Variablen in einer Grafik abbilden.
- Scatterplots mit Fehlerbalken. In diesem Plot werden gleiche X-Werte kombiniert und ein Box/Whisker (Fehlerbalken) zu dem Punkt generiert.
- Grafiken über Ziehen-und-Ablegen kopieren. Grafiken lassen sich einfach über Ziehen kopieren.
- Grafiken in Word-Dokumente ziehen. Grafiken lassen sich in Dokumente von i>STATISTICA oder in externe Dokumente von z.B. Word oder PowerPoint über Ziehen kopieren.
- Grafikdaten als Array verfügbar. Grafikdaten sind als Array für Automationen verfügbar.
- Grafiken sperren. Grafikdateien lassen sich sperren, um Veränderungen durch Anwender zu verhindern.
- Grafiken zusammenfügen. Eine Grafik kann über Ziehen oder Kopieren/Einfügen mit einer Zielgrafik vereint werden.
- Einstellung der Auflösung exportierter Grafiken. Die Auflösung für zu speichernde Grafiken im Format TIFF, GIF, PNG, JPG und BMP lässt sich über das Menü Speichern unter in DPI spezifizieren.
- Rotation von Objekten über die Tastenkombinationen STRG + BILD?/BILD?. Grafische Objekte wie z.B. Pfeile lassen sich über die Windows-Tastaturkombinationen STRG + BILD? und STRG + BILD? in kleinen Schritten drehen.
- Rollbare Legenden. Grafische Legenden, die für die vollständige Darstellung im Grafikfenster zu lang sind, sind rollbar. Über die Symbolleiste kann man die Legende entweder zeilenweise durchblättern oder an den Anfang oder das Ende springen.
- Elemente aus der Legende auswählen. Einzelne Punktmarkierungen oder Linien können aus der Grafiklegende ausgewählt werden.
- Stil- und Achseneinstellungen. Globale grafische Optionen steuern, welcher Teil der grafischen Definitionen bei der Anwendung eines Grafikstils verwendet wird.
- Analyse nach Gruppen
- Die Durchführung von Analysen nach Gruppen wurde deutlich verbessert, indem den meisten Ergebnisdialogen eine entsprechende Schaltfläche hinzugefügt wurde. Die skript-basierte Oberfläche für Analysen nach Gruppen der Version 7 wird aus Kompatibilitätsgründen auch weiterhin unterstützt.
- Die Ergebnisse einer Analyse nach Gruppen kann entweder in einen einzigen Ordner mit eindeutigen Beschreibungen der Ergebnisse für die Gruppen oder in separate Ordner für jede Gruppe geleitet werden.
- Beschriftungen, die die Gruppe identifizieren, können in die Überschriften aller Ausgabeobjekte eingefügt werden.
- Arbeitsmappen
- Multi-Item-Ansicht. Objekte lassen sich direkt aus der Mulit-Item-Ansicht editieren.
- In HTML speichern. Arbeitsmappen können nun im HTML-Format abgespeichert werden. Die Hierarchie der Arbeitsmappenobjekte (Baumansicht) wird in einem Browser-Fenster angezeigt.
- Optimierte Speicherungsstrukturen. Arbeitsmappen lassen sich effizienter speichern. Dadurch erhöht sich auch die Kapazität signifikant.
- Benutzeroberfläche sperren. Diese Option erlaubt es, die Baumstruktur von Arbeitsmappen gegen unabsichtliche oder nicht autorisierte Veränderungen zu schützen.
- Blättern, Auswählen/Aufklappen beim Ziehen. Beim Ziehen von Arbeitsmappenobjekten innerhalb der Baumansicht werden Ordner automatisch aufgeklappt, wenn man das Objekt bei gedrückter Maustaste über die Ordner führt. Damit kann man den gesamten Baum von oben bis unten durchblättern.
|
- Berichte
Neue Berichtsoptionen stehen zur Verfügung:
- Speichern von Berichten aus STATISTICA Enterprise im HTML-Format.
- Speichern von STATISTICA-Tabellen eines STATISTICA-Berichts als HTML-Tabellen, wenn der Bericht im HTML-Format gespeichert wird.
- Einfügen und Löschen von Objekten in/aus Berichten über Automatisierung. Diese Objekteigenschaften wurden STATISTICA Enterprise-Berichten hinzugefügt, stehen aber auch für Automatisierungen zur Verfügung.
- Ausdruck der Berichtstabellen als Objekte oder als vollständige Tabellen auf separaten Seiten.
- Seitenlayout (Hochformat oder Querformat) für jede Seite definieren.
- Daten bereinigen und filtern
- Dubletten filtern. Dubletten sind Fälle, die in den Ausprägungen definierter Variablen genau übereinstimmen. Sie lassen sich aus dem Datenbestand entfernen.
- Unvollständige Daten filtern. Fälle oder Variablen, die einen vom Anwender definierten Anteil fehlender Werte überschreiten, können aus dem Datenbestand eliminiert werden.
- Invariante Variablen filtern. Variablen mit einer Standardabweichung unterhalb eines nutzerdefinierten Schwellenwertes können aus den Daten entfernt werden.
- Ausreißer umkodieren. Unter Verwendung von Kategorial-, Normal-, Grubbs-, Perzentil- und Tukey-Ausreißertests können Ausreißer identifiziert und auf nutzerdefinierte Werte (spezifischer Wert, Missing Data, Mittelwert, Perzentil oder Grenzwert) umkodiert werden.
- Bearbeitung fehlender Werte. Fehlende Werte (Missing Data) können auf einen spezifischen Wert, Mittelwert oder Median umkodiert werden. Variablen, die einen bestimmten Anteil fehlender Werte überschreiten, können markiert und optional auch entfernt werden.
- k-Nearest Neighbor-Interpolation. Fehlende Werte lassen sich mit Hilfe der k-nearest neighbors-Methode schätzen. Der fehlende Wert wird dabei durch einen "durchschnittlichen" Wert ähnlicher Fälle ersetzt.
- Tabellen
- Schneller Import von Textdateien. Es werden schnelle Optionen für den Import von Textdateien angeboten. Die Oberfläche erlaubt die Vorschau auf die Daten, Trennzeichen und Typen werden eigenständig gewählt, jede einzelne Variable kann in der Vorschau ausgewählt und spezifiziert werden.
- Zellenbezüge in Tabellenformeln. In den neuen Formeln können individuelle Zellen der Tabelle in der gleichen Weise referenziert werden wie in typischen Tabellenkalkulations-Applikationen wie Microsoft Excel.
- Neue Tabellenformeln. Neue Formeln für zeilenbasierte Berechnungen schließen ein:
- VCUR - Aktuelle Variablennummer
- VREF - Bezug auf eine Variable
- LAG - Versetzt die Variablenwerte von der aktuellen Zeile um einen definierten Parameterwert
- DIF - Differenz zwischen aktuellem Zeilenwert minus dem Zeilenwert in einem definierten Abstand
- CUSUM - Kumulierte Summe der spezifizierten Variablen
- DATA - Gibt den über Variablen- und Zeilenbezug definierten Wert aus
- NCASES - Aktuelle Zahl der Fälle in der Tabelle
- NVARS - Aktuelle Zahl der Variablen in der Tabelle
- Contains - Textfunktion, die nach einem definierten String in einer definierten Variablen sucht
- Munger - Textfunktion zum Auffinden, Einfügen und Löschen von Textteilen
- Trim - Textfunktion, die Text ohne führende Lehrzeichen ausgibt
- Word - Textfunktion, die das n-te Wort aus einem Text extrahiert
- Item - Textfunktion, die das n-te Wort aus einem Text extrahiert und dabei aufeinander folgende Trennzeichen als unterschiedliche Trennzeichen für fehlenden Worte interpretiert
- Hex - Gibt die hexadezimale Darstellung des Arguments wieder
- Repeat - Textfunktion, die einen definierten Text n-mal wiederholt
- CaseState - Eine Anzahl von Funktionen wurde eingeführt, die sich auf den Fallstatus beziehen.
- Floor - Gibt größten ganzzahligen Wert aus, der kleiner oder gleich einem definierten Wert ist.
- Ceiling - Gibt kleinsten ganzzahligen Wert aus, der größer oder gleich einem definierten Wert ist.
- Round - Rundet Werte auf eine definierte Anzahl von Stellen
- FACT - Berechnet die Fakultät eines ganzzahligen Wertes
- COMBIN - Gibt die Anzahl der Kombinationen von k Elementen aus einer Menge n an
- PERMUT - Gibt die Anzahl der Permutationen von k Elementen aus einer Menge n an
- CHOOSE - Gibt den i-ten Wert eines Arrays aus
- MATCH - Ersetzt beliebige Werte einer Variablen
- IN - Gibt WAHR aus, falls das erste Funktionsargument mit einem der folgenden Argumente übereinstimmt.
- Datumsfunktionen - Vierzehn Datumsfunktionen für das Arbeiten mit Datum, Monat, Wochentag und Zeit wurden eingebaut.
- Erweiterung der Kreuztabellierung (Unstack). Missing Data in Code- oder Fall-ID-Variablen können optional als gültige Werte betrachtet werden, um die Reihenfolge der Variablen in der Ausgabe zu erhalten.
- Sortierung nach bis zu 500 Variablen. Die Sortierung kann bis zu 500 Schlüsselvariablen berücksichtigen.
- Analyse mit Fallauswahlbedingungen. Zur Vermeidung von Fehlern müssen Fallauswahlbedingungen jetzt bestätigt werden, bevor die Option aktiviert wird.
- Textwerte. Wenn in eine Tabellenzelle Text eingegeben wird und für die Variable noch keine Textwerte definiert wurden, erscheint eine Warnmeldung.
- Missing Data. Der voreingestellte Code für fehlende Werte wurde auf -999999998 geändert.
- Verbesserungen beim Zusammenfügen von Daten. Die Reihenfolge der Fälle kann nach dem Zusammenfügen beibehalten werden, so dass die Reihenfolge dieselbe ist wie in der ersten Datenquelle.
- JMP 6-Dateien können eingelesen werden.
- Erweiterungen in WebSTATISTICA Server und Integration von Desktop- und Serverversionen
- Integration in STATISTICA Server. Eine neue Schnittstelle in allen STATISTICA Desktop-Versionen erlaubt die nahtlose Integration in Server-(Web)-Versionen von STATISTICA. Zeitaufwändige Berechnungen lassen sich per Knopfdruck auf den Server laden. Der Fortschritt auf dem Server kann vom Desktop aus beobachtet werden. STATISTICA-Objekte können einfach zwischen den Rechnern ausgetauscht werden.
- Überwachung der WebSTATISTICA Performance. Die Performance lässt sich jetzt mit Windows-Standardwerkzeugen überwachen.
- Erweiterungen in STATISTICA Data Miner
- Der Zugang zum Data-Mining-Menü wurde erleichtert.
- Interactive Trees sind für Deployment verfügbar.
- Der Algorithmus zur Baumbildung berücksichtigt Variablen einzeln.
- Die Grenze für nichtparametrische Methoden wurde auf eine Million Fälle erhöht.
- Dem Knoten Rapid Deployment wurden Lift-Tabellen für alle Typen hinzugefügt.
- Data Miner Recipe (DMR). Ein rezeptartiger Assistent führt Schritt-für-Schritt durch den Data-Mining-Prozess:
- Verbindung zu den Daten
- Modifikation und Aufbereitung der Daten
- Durchführung von Berechnungen
- Betrachtung der Ergebnisse
- Speichern/Deployment
- Projektdateien können generiert und an jedem Prozessschritt gespeichert werden; Data-Miner-Recipes lassen sich zum Scoring in STATISTICA Enterprise einbinden.
- Entwicklungsumgebung / Integrationswerkzeuge
- OLE DB Provider für STATISTICA-Tabellen. STATISTICA-Tabellen können aus OLE DB-kompatiblen Applikationen über Standard-SQL abgefragt werden.
- Grafikdaten als Array. Grafikdaten stehen für Automatisierungen in Daten-Arrays zur Verfügung.
- Benutzeroberfläche von Arbeitsmappen sperren. Auch über Automatisierung ist es möglich, die Baumstruktur von Arbeitsmappen gegen unabsichtliche oder nicht autorisierte Veränderungen zu schützen.
- Neue Tabellenformeln. Die oben gelisteten neuen Tabellenformeln stehen auch für Automatisierungen zur Verfügung.
- Schnittstelle zu externen Log-Dateien. STATISTICA bietet jetzt eine Schnittstelle, mit der externen Applikationen Log-Dateien als Berichte oder Text-Dateien zur Verfügung gestellt werden können.
- Überwachung der WebSTATISTICA Performance. Die Performance lässt sich jetzt mit Windows-Standardwerkzeugen überwachen.
SANN - STATISTICA AUTOMATED NEURAL NETWORKS
STATISTICA Automated Neural Networks ist eine leistungsfähige und einfach zu bedienende Anwendung, die moderne Technologien und Algorithmen zur Bildung und Anwendung künstlicher neuronaler Netzwerkmodelle bietet. Diese Anwendung ersetzt das Produkt STATISTICA Neural Networks, das mit STATISTICA 7 angeboten wurde. Sie beinhaltet:
- Regression (zur Implementierung von Regressionsmodellen nicht-sequentieller Daten)
- Klassifikation (zur Implementierung von Klassifikationsmodellen nicht-sequentieller Daten)
- Zeitreihen-Regression (zur Implementierung von Regressionsmodellen mit Zeitreihendaten)
- Zeitreihen-Klassifikation (zur Implementierung von Klassifikationsmodellen mit Zeitreihendaten)
- Clusteranalysen (mit Kohonen-Maps).
|
Folgende STATISTICA Module sind in der Desktop-Linie verfügbar:
|
|
|
| |
|
|
|
Die gebräuchlichste Anwendung von Grafiken besteht in der effizienten Darstellung und Übermittlung von Informationen – üblicherweise numerische Daten. Grafische Verfahren liefern allerdings auch mächtige analytische Werkzeuge zur Exploration von Daten und Verifikation von Hypothesen.
Ein breites Angebot von Grafikoptionen. STATISTICA bietet eine umfassende Auswahl von grafischen Methoden zur Datenanalyse und zur Präsentation von Ergebnissen. Alle Grafiken in STATISTICA beinhalten ein breites Spektrum von interaktiven analytischen Verfahren und Anpassungswerkzeugen, die Ihnen eine benutzergerechte Gestaltung aller Darstellungsaspekte ermöglichen. Darüber hinaus sind flexible Möglichkeiten zur Handhabung von multiplen Grafiken verfügbar, mit denen sich diverse grafische Darstellungen integrieren und dynamische Verknüpfungen zwischen Anwendungen herstellen lassen (z.B. über OLE – Object Linking and Embedding).
Umfassende Unterstützung von Visual Basic und anderen Sprachen. Die grafischen Optionen von STATISTICA sind auch über Programmierung zugänglich (mittels des eingebauten STATISTICA Visual Basic oder anderer kompatibler Sprachen), was nahezu unbegrenzte Möglichkeiten zum Erstellen hochangepasster grafischer Darstellungen eröffnet. Diese benutzerdefinierten Grafiken lassen sich später dauerhaft in die Benutzeroberfläche von STATISTICA einbinden (z.B. durch Hinzufügen einer Schaltfläche in die Symbolleiste oder Eintrag im Menü).

Allgemeine Kategorien von Grafiken. STATISTICA bietet ein Spektrum von Methoden an, mit denen Grafiken aufgerufen oder definiert werden können. Diese Methoden bieten verschiedenste (individuell gestaltbare) Grafiktypen für Rohdaten und beliebig zu markierende Zahlenblöcke. Daneben existieren eine Reihe an Grafiken, die sich auf spezielle statistische Verfahren beziehen (z.B. Eiszapfen-Diagramme bei der Clusteranalyse). Die verschiedenen Grafikkategorien ergänzen sich gegenseitig und liefern ein hohes Integrationsniveau zwischen Zahlen (wie Rohdaten, Zwischen- oder Endergebnissen) und grafischer Darstellung.
|
| |
|
|
STATISTICA Basis bietet eine breite Auswahl an Verfahren für explorative Analysen:
Deskriptive Statistiken und Grafiken. Das Programm berechnet sowohl alle allgemeinen deskriptiven Statistiken, wie Mediane (Zentralwerte), Mittelwerte, Modalwerte, Quartile, benutzerdefinierte Perzentile, Varianzen und Standardabweichungen, Quartilsabstände, Konfidenzintervalle für den Mittelwert, Schiefe und Exzess mit Standardfehlern, harmonische und geometrische Mittel als auch viele spezielle deskriptive Statistiken und Diagnose-Kenngrößen. Wie auch in allen anderen Modulen von STATISTICA unterstützt eine Vielzahl von Grafiken die explorativen Analysen. Dazu zählen verschiedene Typen von Box-Whisker-Plots, Histogramme, bivariate Histogramme (3D oder in Kategorien), 2D- und 3D-Scatterplots mit hervorgehobenen Teilmengen, gewöhnliche, einseitige und trendbereinigte Verteilungsplots, Q-Q-Plots, P-P-Plots usw. Die Güte der Anpassung der Normalverteilung an die Daten kann auf der Basis ausgewählter Tests überprüft werden (Kolmogorov-Smirnov-, Lilliefors- und Shapiro-Wilks-Test). Außer der Normalverteilung kann eine Vielzahl weiterer Verteilungen angepasst werden (siehe auch STATISTICA Prozessanalyse und informationen zu Grafiken in STATISTICA).
Analysen nach Gruppen. Deskriptive Statistiken und Grafiken lassen sich aus nach einer oder mehreren Gruppierungsvariablen gegliederten Daten erstellen. So kann der Benutzer mit einigen Mausklicks die Daten z.B. nach dem Geschlecht (Variable Gender) und dem Alter (Variable Age) seiner Probanden gruppieren, um Histogramme, Box-Whisker-Plots, Normalverteilungsplots, Scatterplots usw. in Kategorien erstellen zu lassen. Werden mehr als zwei kategoriale Variablen ausgewählt, können Stapel überlappender Fenster der jeweiligen Grafiken automatisch erstellt werden. Für die Gruppierung nach Werten stetiger Variablen stehen Optionen zur Verfügung, mit denen z.B. die Werte einer Variablen in eine vorgegebene Anzahl von Intervallen aufgeteilt werden. Alternativ dazu kann die Funktion zum Umkodieren eingesetzt werden, mit der der Benutzer präzise vorgegeben kann, wie die Variable umkodiert werden soll. Diese Anweisungen zum Umkodieren können beliebig komplex ausfallen und sich auf alle Variablen der Datendatei beziehen. Darüber hinaus gibt es eine spezielle hierarchische Breakdown-Prozedur, die es dem Benutzer gestattet, die Daten nach bis zu sechs kategorialen Variablen zu gliedern, um anschließend eine Vielzahl von Grafiken in Kategorien, deskriptive Statistiken und Korrelationsmatrizen für Untergruppen zu erstellen. Zahlreiche Optionen zur Formatierung und zum Anbringen von Labels ermöglichen es dem Benutzer, publikationsreife Tabellen und Berichte zu verfassen. In dieser Breakdown-Prozedur können Designs extremen Umfangs, z.B. 300 Gruppen für eine einzelne Gruppierungsvariable, spezifiziert werden. Die Ergebnisse beinhalten alle relevanten ANOVA-Statistiken, einschließlich der vollständigen ANOVA-Tabelle, dem Levene-Test auf Varianzhomogenität usw. Wie in allen anderen Modulen von STATISTICA werden die Berechnungen mit erweiterter Genauigkeit ("vierfacher" Genauigkeit, wenn verfügbar) durchgeführt. Aufgrund der interaktiven Struktur des Programms gestaltet sich die Exploration der Daten sehr einfach. So können z.B. explorative Grafiken direkt aus den Tabellen mit den Ergebnissen erstellt werden, indem mit der Maus auf ausgewählte Zellen oder Bereiche von Zellen gezeigt wird. Mit einem einzelnen Mausklick können Stapel komplexer Grafiken erstellt werden, die anschließend durch Klicken auf die Schaltfläche Weiter Grafik für Grafik betrachtet werden können. Alle Gliederungen von Tabellen und Gruppierungen können vom Benutzer vordefiniert werden, um die Anzahl der notwendigen Mausklicks zu reduzieren. Alle explorativen grafischen Verfahren, sind in die statistischen Verfahren integriert, um die grafische Datenanalyse z.B. durch interaktive Ausreißer-Elimination, Auswahl von Teilmengen, Glättung, Funktionsanpassung, Brushing zu unterstützen. Siehe auch den Abschnitt über Blockstatistiken weiter unten.
|


|
| |
|
|
Ein umfassender Satz von Optionen steht für die Untersuchung der Korrelationen zwischen Variablen zur Verfügung. Zunächst können alle üblichen Assoziationsmaße, wie Pearsons r, Spearmans R, Kendalls Tau (b, c), Gamma, tetrachorisches r, Phi, Cramers V, Kontingenzkoeffizient C, Sommers d, Unsicherheitskoeffizienten, partielle und Part-Korrelationen, Autokorrelationen, verschiedene Distanzmaße usw. berechnet werden. Nichtlineare Regression, Regression für zensierte Daten und weitere Analysen zu Abhängigkeiten zwischen Variablen sind in den Modulen Allgemeine Lineare/Nichtlineare Regression, Survival- und Ausfallzeitenanalyse und weiteren Modulen in STATISTICA Höhere Modelle verfügbar. Fehlende Werte können bei der Berechnung von Korrelationsmatrizen fallweise oder paarweise ausgeschlossen bzw. durch Mittelwerte ersetzt werden. Wie in allen anderen Modulen von STATISTICA werden die Berechnungen mit erweiterter Genauigkeit durchgeführt. Die Darstellung von Korrelationsmatrizen in Ergebnistabellen lässt sich über verschiedene Formatierungsoptionen (siehe unten) steuern. Für die Visualisierung der numerischen Ergebnisse steht eine leistungsfähige Funktionalität zur Verfügung. Zeigt der Benutzer auf einen bestimmten Korrelationskoeffizienten in der Ergebnistabelle, kann er aus einer Vielzahl von grafischen Darstellungen wählen (z.B. Scatterplots mit Konfidenzintervallen, verschiedene bivariate 3D-Histogramme, Verteilungsplots).
Brushing und Ausreißerdiagnose. Die umfassenden Funktionen des Brushing ermöglichen es dem Benutzer, in Scatterplots einzelne Datenpunkte aus- bzw. abzuwählen, um deren Einfluss auf die Regressiongerade oder andere Regressionsfunktionen zu bewerten.
Anzeigeformate von Zahlen. Für die Korrelationskoeffizienten werden eine Vielzahl von globalen Anzeigeformaten unterstützt. So können z.B. signifikante Korrelationskoeffizienten automatisch markiert werden; jede Zelle der Ergebnistabelle kann um die Anzeige von n und p erweitert werden; es können außerdem ausführliche Ergebnisse angefordert werden, die dann alle deskriptiven Statistiken (paarweise Mittelwerte und Standardabweichungen, Regressionskoeffizienten (B's), Regressionskonstanten ) enthalten. Wie auch bei allen anderen numerischen Ergebnissen steht für die in Ergebnistabellen angezeigten Korrelationsmatrizen eine Zoom-Option und eine interaktive Steuerung des Anzeigeformats zur Verfügung (z.B. von +,4 bis +,41358927645193). Große Matrizen können also entweder mit Hilfe der Zoom-Option oder über die einstellbare Spaltenbreite komprimiert dargestellt werden. Damit wird die Suche nach Koeffizienten, die eine vom Benutzer spezifizierte Größe oder ein gewähltes Signifikanzniveau überschreiten (die in der Ergebnistabelle rot markiert werden.
Scatterplot, Scatterplotmatrizen, gruppierte Analysen. Wie in allen Ausgabedialogen stehen zahlreiche globale Grafik-Optionen zur Verfügung, mit denen die Beziehungen zwischen den Variablen weiter untersucht werden können. Dazu zählen z.B. 2D- und 3D-Scatterplots (mit oder ohne Labels), um Muster in den Beziehungen zwischen Untergruppen von Fällen oder mehreren Variablen zu identifizieren. Korrelationsmatrizen können nach Werten von Gruppierungsvariablen getrennt berechnet und anhand von Scatterplots in Kategorien visualisiert werden. Auch "gegliederte Tabellen von Korrelationsmatrizen" können generiert (eine Matrix pro Teilmenge der Daten) und in Schlangen von Ergebnistabellen angezeigt werden (die später als Eingabe im Modul Structural Equations Modeling and Path Analysis (SEPATH) der STATISTICA Höhere Modelle eingesetzt werden kann). Eine vollständige Korrelationsmatrix kann in einer einzigen Scatterplotmatrix veranschaulicht werden. Große Scatterplotmatrizen können dann interaktiv durch Vergrößern der ausgewählten Teile der Grafik bzw. durch Durchblättern im Zoom-Modus betrachtet werden. Auch diese Scatterplotmatrizen können nach Gruppierungsvariablen gegliedert werden (ein Matrixplot für jede Teilmenge der Daten). Alternativ dazu kann eine Scatterplotmatrix für multiple Teilmengen der Daten erstellt werden, in der die jeweiligen Teilmengen, die z.B. durch Stufen einer Gruppierungsvariable oder Auswahlbedingungen beliebiger Komplexität definiert wurden, im Plot durch verschiedene Symbole charakterisiert sind. Verschiedene weitere grafische Methoden können zur Visualisierung von Matrizen von Korrelationen bei der Suche nach globalen Mustern (z.B. Konturenplots, ungeglättete Flächen, Icons ) eingesetzt werden. All diese Operationen erfordern nur wenige Mausklicks und können durch den Einsatz verschiedener Shortcuts weiter vereinfacht werden. Eine beliebige Anzahl von Ergebnistabellen und Grafiken können gleichzeitig auf dem Bildschirm dargestellt werden, wodurch interaktive explorative Analysen und Vergleiche sehr einfach durchzuführen sind.
|


|
| |
|
|
STATISTICA ist ein integriertes Analysesystem, das alle numerischen Ergebnisse in Tabellen darstellt, die sich (ohne weitere Veränderungen) als Eingabe für nachfolgende Analysen eignen. Demzufolge lassen sich elementare Statistiken (oder jede andere statistische Analyse) für Ergebnistabellen vorangegangener Analysen berechnen. Sie können beispielsweise eine Tabelle mit Mittelwerten für 2000 Variablen erzeugen und letztere danach als Eingabedatei für die Analyse der Verteilung dieser Mittelwerte nutzen. Elementare Statistiken sind also jederzeit im Verlauf Ihrer Analyse abrufbar und lassen sich auf jede Ergebnistabelle anwenden.
Blockstatistiken. Zusätzlich zu diesen Funktionen für Einzeldaten werden Funktionalitäten zur Erstellung von Statistiken und statistischen Grafiken angeboten, die auf beliebig ausgewählten (markierten) Blöcken von Werten des aktuellen Datenblattes oder der Ergebnistabelle basieren. Wenn Sie z.B. eine Ergebnistabelle mit Lagemaßen für 2000 Variablen (z.B. mit Mittelwerten, Modalwerten, Medianen, geometrischen Mittelwerten und harmonischen Mittelwerten) erzeugt haben, können Sie beispielsweise einen Block von 200 Variablen samt Mittelwerten und Medianen markieren und durch eine einzige Operation eine multiple Liniengrafik mit diesen beiden Maßen für die Untergruppe von 200 Variablen generieren. Diese Ausgaben können auf Zeilen oder Spalten des aktuell markierten Blocks basieren. So können Sie beispielsweise für eine Untergruppe von Variablen einen multiplen Linienplot aus den unterschiedlichen Lagenmaßen erzeugen.
|
 |
| |
|
|
Ein flexibler interaktiver Wahrscheinlichkeitsrechner ist über alle Symbolleisten zu erreichen. Er enthält eine umfangreiche Auswahl von Verteilungen, einschließlich Beta, Cauchy, Chi-Quadrat, Exponential, Extremwert, F, Gamma, Laplace, Lognormal, Logistische, Pareto, Rayleigh, t (Student), Weibull und Z (Normal). In den Eingabedialog sind kleine Grafiken der Dichte- und der Verteilungsfunktion integriert, die es dem Benutzer ermöglichen, die Eigenschaften dieser beiden Funktionen zu veranschaulichen. Dabei können Mikro-Rollbalken eingesetzt werden, um entweder die letzte Ziffer der Eingabe (LINKE Maustaste) oder die vorletzte Ziffer (RECHTE Maustaste) zu verändern. Darüber hinaus können Verbundgrafiken der Verteilungen erstellt werden, in denen die im Dialog eingegebenen Argumente verdeutlicht werden. Damit können Zusammenhänge zwischen Argumenten, Wahrscheinlichkeiten und Parametern der Verteilung interaktiv untersucht werden.
|
 |
| |
|
|
T-Tests können sowohl für abhängige als auch für unabhängige Stichproben durchgeführt werden. Außerdem kann Hotellings T² berechnet werden [siehe auch ANOVA/MANOVA und ALM (Allgemeines lineares Modell) in STATISTICA Höhere Modelle]. Flexible Optionen für Vergleiche zwischen Variablen (z.B. die Behandlung von Daten jeder einzelnen Spalte als eine separate Stichprobe) und kodierten Gruppen (z.B. falls die Daten eine kategoriale Variable wie Geschlecht zum Identifizieren der Gruppenzugehörigkeit eines jeden Falles enthalten) werden bereitgestellt. Im Ergebnisdialog stehen vielfältige Optionen für Diagnose-Kenngrößen und Grafiken zur Verfügung. Beim t-Test für unabhängige Stichproben betrifft das beispielsweise Optionen für die Durchführung des Tests mit getrennten Varianzschätzungen, den Levene-Test auf Varianzhomogenität, verschiedene Box-Whisker-Plots, Histogramme, Verteilungsplots und Scatterplots in Kategorien und weitere. Weitere speziellere Tests auf Unterschiede zwischen Gruppen sind Bestandteil anderer Module (z.B. Nichtparametrische Verfahren (unten), Survival- und Ausfallzeitenanalyse (in STATISTICA Höhere Modelle), Reliability/Item Analyse (in STATISTICA Explorative Verfahren).
|
 |
| |
|
|
Für die Tabellierung von stetigen, kategorialen und Mehrfachantworten-Variablen stehen leistungsfähige Prozeduren zur Verfügung. Das Layout und die Formatierung der Tabellen kann über eine Vielzahl von Optionen gesteuert werden. So können z.B. für Tabellen, die Mehrfachantworten-Variablen (mehrfache Kategorien und Dichotomien) enthalten, Randhäufigkeiten und Anteile basierend auf der Anzahl der Antworten oder Antwortenden bestimmt werden; Mehrfachantworten-Variablen können paarweise verarbeitet werden, wobei verschiedene Optionen für die Behandlung fehlender Daten (Missing Data) zur Auswahl stehen. Außerdem können Häufigkeitstabellen basierend auf benutzerdefinierten, logischen Auswahlbedingungen beliebiger Komplexität, die Fällen Kategorien zuordnen, erstellt werden. Alle Tabellen können nachbearbeitet werden, um publikationsreife Berichte zu produzieren. So können z.B. zusammenfassende "Mehrfach-Tabellen" im Breakdown-Stil oder mit hierarchischer Anordnung der Faktoren erstellt werden; Kontingenztabellen können Zeilen-, Spalten- oder Gesamtprozente in jeder Zelle ausgeben; es können lange Wertelabels zur Beschreibung der Kategorien verwendet werden; Häufigkeiten, die einen festgelegten Schwellenwert überschreiten, können in der Tabelle hervorgehoben werden usw. Das Programm ist in der Lage, kumulierte oder relative Häufigkeiten, Logit- und Probit-transformierte Häufigkeiten, erwartete Häufigkeiten bei Normalverteilung (sowie Kolmogorov-Smirnov-, Lilliefors- und Shapiro-Wilks-Test), erwartete und Residual-Häufigkeiten in Kontingenztabellen zu berechnen usw. In Kontingenztabellen stehen folgende statistische Tests zur Verfügung: Pearsons, Maximum-Likelihood und Yates-korrigierte Chi-Quadrate, McNemars Chi-Quadrat, der exakte Test von Fisher (ein- und zweiseitig), Phi und das tetrachorische r; zusätzliche Statistiken beinhalten Kendalls Tau (a, b), Gamma, Spearmans R, Sommers D, Unsicherheitskoeffizienten usw.
Grafiken. Unter den grafischen Optionen finden sich einfache, mehrfache (in Kategorien) und 3D-Histogramme, Histogramme für beliebige Schnitte durch die "Schichten" der mehrdimensionalen Kontingenztabellen und viele weitere Grafiken einschließlich eines einzigartigen "Interaktionsplots für Häufigkeiten", der die Häufigkeiten für komplexe Kontingenztabellen zusammenfasst und mit einem Plot der Mittelwerte in der ANOVA zu vergleichen ist. Stapel komplexer Grafiken (z.B. für mehrfache Kategorien) können interaktiv ausgewertet werden. Siehe auch den Absatz über Blockstatistiken (oben) und die Absätze über Log-lineare Analyse (in STATISTICA Höhere Modelle) und Korrespondenzanalyse (in STATISTICA Explorative Verfahren).
|
 |
| |
|
|
Das Modul Multiple Regression stellt eine umfassende Implementation von Verfahren der linearen und quasilinearen Regression dar, in das einfache, multiple, schrittweise (vorwärts, rückwärts, in Blöcken), hierarchische, quasilineare (einschließlich polynomiale, exponentielle, logarithmische ) Modelle, Modelle mit und ohne Konstante, Verfahren der Ridge-Regression und Verfahren für gewichtete kleinste Quadrate integriert sind. Weitere höhere Verfahren werden im Modul Allgemeine Regressionsodelle angeboten (z.B. Beste-Subset-Regression, multivariate schrittweise Regression für multiple abhängige Variablen, für Modelle mit Wirkungen kategorialer Faktoren; statistische Ergebnisse für Validierungs- und Analyse-Stichproben, benutzerdefinierte Hypothesen, usw.). Das Programm berechnet einen umfassenden Satz von Statistiken und erweiterten Diagnose-Kenngrößen, einschließlich der vollständigen Regressionstabelle (mit Standardfehlern für B, Beta und Konstante, R² und korrigiertes R² und ANOVA-Tabelle), Matrizen von partiellen und Part-Korrelationskoeffizienten, Korrelationen und Kovarianzen für die Regressionskoeffizienten, die Sweep-Matrix (inverse Matrix), die Durbin-Watson-Statistik, Mahalanobis- und Cooks-Distanzen, Residuen für gelöschte Beobachtungen, Konfidenzintervalle für Prognosewerte und viele weitere.
Prognosewerte und Residuen. Für die Residuen- und Ausreißer-Analyse steht eine große Auswahl von Plots zur Verfügung, die u.a. eine Vielzahl von Scatterplots, Histogramme, einfache, einseitige und trendbereinigte Normalverteilungsplots, Plots partieller Korrelationen, verschiedene fallweise Residuen- und Ausreißerplots enthalten. Die Scores für einzelne Fälle können anhand explorativer Iconplots und anderer mehrdimensionaler Grafiken visualisiert werden, die direkt in die Ergebnistabelle der Ergebnisse integriert sind. Residuen und Prognosewerte können der aktuellen Datendatei automatisch angefügt werden. Ein Prognoseverfahren erlaubt es dem Benutzer, Was-wäre-wenn-Analysen durchzuführen, wobei die Prognosewerte basierend auf benutzerspezifizierten Werten der unabhängigen Variablen interaktiv berechnet werden können.
Gruppierte Analysen; verwandte Verfahren. Designs extremen Umfangs, d.h. 500 Variablen oder mehr lassen sich analysieren. Eine Option zur multiplen Regressionsanalyse für gruppierte Daten wird ebenfalls bereitgestellt (multiple Regression nach Gruppen). Ein Add-On von zusätzlichen Verfahren enthält eine Regressionsprozedur, die sowohl Modelle mit Tausenden von Variablen und zweistufige Kleinste-Quadrate-Regression als auch Box-Cox- und Box-Tidwell-Transformationen mit Grafiken unterstützt. STATISTICA Höhere Modelle enthält auch Module zur Schätzung allgemeiner nichtlinearer Ansätze (Nichtlineare Regression, Verallgemeinertes Lineares Modell (VLM), Verallgemeinertes Additives Modell (VAM), Partielle Kleinste Quadrate (PKQ)) , in dem die Parameter jedes benutzerdefinierten, nichtlinearen Modells geschätzt werden können. In diesem Modul ist eine Auswahl vordefinierter Modelle, einschließlich Logit, Probit und anderen enthalten. STATISTICA Höhere Modelle bietet im Modul SEPATH, das der allgemeinen Modellierung von Strukturgleichungen und der Pfadanalyse gewidmet ist, die Möglichkeit, Korrelations-, Kovarianz- oder Momentmatrizen extremer Größe zu analysieren.
|
 |
| |
|
|
Das Modul Nichtparametrische Verfahren stellt eine umfassende Auswahl deskriptiver und schließender Statistiken einschließlich der gebräuchlichen Tests und einiger spezieller Verfahren bereit. Im einzelnen sind folgende Tests vorhanden: Wald-Wolfowitz' Runs-Test, Mann-Whitneys U-Test (mit exakten Wahrscheinlichkeiten anstelle der Z-Approximation für kleine Stichproben), Kolmogorov-Smirnov-Tests, Wilcoxon-Test für verbundene Stichproben, Kruskal-Wallis Rang-Varianzanalyse, Median-Test, Vorzeichentest, Friedmans Rang-Varianzanalyse, Cochrans Q-Test, McNemar-Test, Kendalls Konkordanzkoeffizient, Kendalls Tau (b, c), Spearmans R, Fishers exakter Test, Chi-Quadrat-Tests, V-Quadrat-Statistik, Phi, Gamma, Sommers d, Kontingenzkoeffizienten und weitere. (Spezielle nichtparametrische Tests und Statistiken sind auch Teil weiterer Module, z.B. Survival- und Ausfallzeitenanalyse, STATISTICA Prozessanalyse und andere.) Alle auf Rängen basierenden Tests verwenden Korrekturen für kleine Stichprobenumfänge oder verbundene Ränge. Wie in allen anderen Modulen von STATISTICA sind bei allen Tests entsprechende Grafiken integriert, z.B. verschiedene Scatterplots, spezielle Box-Whisker-Plots, Linienplots, Histogramme und viele weitere 2D- und 3D-Darstellungen.
|
 |
| |
|
|
Das Modul ANOVA / MANOVA ist eine Untermenge des Moduls Allgemine Lineare Modelle (ALM) und kann univariate und multivariate Varianzanalysen für faktorielle Designs mit oder ohne einen Messwiederholungsfaktor ausführen. Das Modul Allgemeine Lineare Modelle (ALM) ermöglicht die Spezifikation linearer Modelle mit kategorialen und/oder stetiger Prädiktorvariablen, Zufallseffekten und mehreren Messwiederholungsfaktoren (schrittweise und Beste-Subset-Optionen werden im Modul Allgemeine Regressionsmodelle (ARM) angeboten).
Benutzeroberflächen. Sie können alle Designs auf einfachste Weise beschreiben, indem Sie das Design in Abhängigkeit von den aktuellen Variablen und deren Stufen spezifizieren, und nicht auf technischem Weg, z.B. durch Spezifizieren von Matrizen mit Codes von Dummy-Variablen. Dadurch sind auch weniger erfahrene Benutzer in der Lage, selbst komplexe Designs mit Hilfe von STATISTICA. ANOVA / MANOVA bietet ebenso wie das Modul Allgemeine Lineare Modelle (ALM) drei alternative Benutzeroberflächen zum Spezifizieren der Designs:
(1) einen Assistenten, der Sie Schritt für Schritt durch den Prozess der Designspezifikation führt,
(2) eine dialogorientierte Benutzeroberfläche zur Auswahl von Variablen, Codes, Faktorstufen und Designoptionen, sowie
(3) einen Editor zur Designspezifikation über Schlüsselwörter auf der Grundlage einer allgemeinen Designsyntax.
Berechnungsverfahren. Per Voreinstellung verwendet das Programm die sigmabeschränkte Parametrisierung für faktorielle Designs und den Ansatz der effektiven Hypothese (siehe Hocking, 1981), Wenn das Design unbalanciert oder unvollständig ist, lassen sich auch Typ I-, II-, III- und IV-Hypothesen berechnen, ebenso wie Typ V- und Typ VI-Hypothesen zum Testen der üblichen Analysen fraktioneller faktorieller Designs für industrielle und qualitätsverbessernde Anwendungen (siehe auch die Beschreibung im Modul Versuchsplanung).
Ergebnisse. Das Modul ANOVA / MANOVA ist in seinen Berechnungsverfahren und Ergebnisausgaben sehr weitreichend, so dass die gesamte Bandbreite analytischer Verfahren der Allgemeinen Linearen Modelle verfügbar ist (zu weiteren Einzelheiten siehe die Beschreibung von Allgemeine Lineare Modelle). Die Ergebnisse umfassen ANOVA-Tabellen, univariate und multivariate Ergebnisse für Messwiederholungsfaktoren mit mehr als zwei Stufen, Korrekturen nach Greenhouse-Geisser und Huynh-Feldt, Interaktionsplots, detaillierte deskriptive Statistiken, detaillierte Residualstatistiken, geplante Vergleiche und Post-hoc-Tests, Tests für benutzerdefinierte Hypothesen und benutzerdefinierte Fehlerterme, detaillierte Diagnosestatistiken und -plots (z.B. ein Histogramm von Innerzellenresiduen, Tests auf Varianzhomogenität, Plots von Mittelwert gegen Standardabweichungen).
|
|
| |
|
|
Die Optionen zur Verteilungsanpassung ermöglichen den Vergleich der (empirischen) Verteilung einer Variablen mit einer großen Zahl von theoretischen Verteilungen. Für die Anpassung an die Daten stehen Normal-, Rechteck-, Exponential-, Gamma-, Lognormal-, Chi-Quadrat-, Weibull-, Gompertz-, Binomial-, Poisson-, Geometrische und Bernoulli-Verteilung zur Wahl. Die Güte der Anpassung kann mittels des Chi-Quadrat-Tests oder des Kolmogorov-Smirnov-Einstichprobentests bewertet werden. Auch der Lilliefors- und Shapiro-Wilks-Test sind implementiert (siehe oben). Die Anpassungsgüte einer bestimmten, hypothetischen Verteilung an die empirische Verteilung kann zusätzlich anhand von gewöhnlichen und kumulierten Histogrammen mit darübergelegten, entsprechend ausgewählten Funktionen (Dichten, Verteilungsfunktionen) bzw. Linien- und Balkengrafiken für die erwarteten und beobachteten Häufigkeiten bewertet werden. Weitere Optionen zur Verteilungsanpassung sind im Modul STATISTICA Prozessanalyse verfügbar, in dem Maximum-Likelihood-Schätzungen der Parameter für Beta-, Exponential-, Extremwert- (Typ I, Gumbel), Gamma-, Lognormal-, Rayleigh- und Weibull-Verteilung berechnet werden können. In diesem Modul stehen außerdem sowohl Optionen zur automatischen Anpassung, d.h. der automatischen Wahl der an die Daten "bestangepassten" Verteilung, als auch Optionen zur allgemeinen Verteilungsanpassung anhand der ersten vier Momente (über Johnson- und Pearson-Kurven) zur Verfügung. In den Grafiken können auch benutzerdefinierte 2- und 3-dimensionale Funktionen dargestellt und "über die Grafiken gelegt" werden. Bei der Definition dieser Funktionen kann auf eine Vielzahl von Verteilungen direkt Bezug genommen werden. Dazu gehören Beta-, Binomial-, Cauchy-, Chi-Quadrat-, Exponential-, Extremwert-, F-, Gamma-, Geometrische, Laplace-, Logistische, Normal-, Lognormal-, Pareto-, Poisson-, Rayleigh-, Students t- sowie Weibull-Verteilung (Dichte- bzw. Wahrscheinlichkeitsfunktion, Verteilungsfunktion und deren Inverse). Unter dem Thema Nichtlineare Regression (in STATISTICA Höhere Modelle) zusätzliche Möglichkeiten zur Anpassung vor- oder benutzerdefinierter Funktionen beschrieben.
|
 |
| |
|
| |
|
Folgende Modulgruppen sind in Professionell enthalten
|
|
|
| |
|
STATISTICA Höhere Modelle bietet ein breites Spektrum von hochentwickelten linearen und nichtlinearen Modellierungswerkzeugen, unterstützt stetige und kategoriale Prädiktoren, Interaktionen, hierarchische Modelle, Einrichtungen zur automatischen Modellwahl, außerdem Varianzkomponenten, Zeitreihenanalyse und viele andere Verfahren. Alle Analysen sind mit interaktiven Grafiken und eingebautem Visual Basic-Skripting ausgestattet. Folgende Teilmodule sind enthalten:
- Varianzkomponenten und Gemischte-Modelle-ANOVA/ANCOVA
Varianzkomponenten und Gemischte-Modelle-ANOVA/ANCOVA ist ein spezielles Modul für Designs mit zufälligen Effekten und/oder Faktoren mit vielen Stufen. Optionen zur Behandlung von zufälligen Effekten und Schätzung von Varianzkomponenten werden auch im Modul Allgemeine Lineare Modelle angeboten. Solche Faktoren treten häufig in der industriellen Forschung bei der Realisierung einer zufälligen Variablen als Faktorstufen auf, so dass letztere nicht vom Experimentator oder Ingenieur gezielt eingestellt werden können. Das Modul Varianzkomponenten erlaubt die Analyse von Designs mit beliebigen Kombinationen fester/zufälliger Effekte und mit Kovariablen. Es können ANOVA/ANCOVA-Designs selbst extremer Größe effektiv analysiert werden. Die Faktoren können Hunderte von Stufen besitzen. Das Programm analysiert gewöhnliche faktorielle kreuzklassifizierte Designs und berechnet die üblichen Typ I-, II- und III-Quadratsummen der Varianzanalyse sowie die mittleren Quadrate für die im Modell befindlichen Effekte. Außerdem können Sie die Tabelle der erwarteten mittleren Quadrate für die im Modell befindlichen Effekte, die Varianzkomponenten für die zufälligen Effekte im Modell, die Koeffizienten der Nenner-Synthese (denominator synthesis) und die vollständige ANOVA-Tabelle mit den auf den zusammengesetzten (synthetisierten) Fehlertermen und den entsprechenden Freiheitsgraden basierenden Tests berechnen (unter Verwendung von Satterthwaites Methode). Darüber hinaus werden weitere Methoden zur Schätzung der Varianzkomponenten unterstützt (z.B. MIVQUE(0), Maximum-Likelihood (ML), Restringierte Maximum-Likelihood (REML)). Für die Maximum-Likelihood-Schätzung werden der Newton-Raphson- und der Fisher-Scoring-Algorithmus verwendet. Für die Anzeige der gewichteten und ungewichteten Randmittelwerte und deren Konfidenzintervallen stehen verschiedene Optionen zur Verfügung. Umfangreiche Grafik-Optionen können für die Visualisierung der Ergebnisse eingesetzt werden.
- Survival- und Ausfallzeitenanalyse
Dieses Modul enthält eine umfassende Implementation einer Vielzahl von Verfahren zur Analyse zensierter Daten sowohl aus der biologischen, medizinischen und Sozialforschung als auch aus den Ingenieurwissenschaften und der Marktforschung. Neben der Berechnung von Sterbetafeln mit verschiedenen deskriptiven Statistiken und Kaplan-Meier-Schätzern kann der Benutzer die Survival-Funktionen in verschiedenen Gruppen unter Verwendung einer Reihe von Testverfahren vergleichen. Dazu gehören Gehan-Test, Cox' F-Test, Cox-Mantel-Test, Log-Rang-Test und Peto & Petos verallgemeinerter Wilcoxon-Test. Außerdem können Kaplan-Meier-Plots für Gruppen erstellt werden, wobei die unzensierten Beobachtungen in den Grafiken durch verschiedene Punktmuster gekennzeichnet werden. Das Programm bietet weiter eine Auswahl von Verfahren zur Anpassung von Survival-Funktionen an die Daten (Exponential, Linear-Hazard, Gompertz und Weibull), die auf ungewichteten oder gewichteten KQ-Methoden basieren. Maximum-Likelihood-Schätzungen der Parameter für verschiedene Verteilungen, einschließlich der Weibull-Verteilung, können im Modul STATISTICA Prozessanalyse durchgeführt werden. Schließlich enthält das Programm vollständige Implementationen der vier allgemeinen Modelle (Cox’ Proportional Hazard Modell, exponentielle Regression, lognormale und normale Regressionsmodelle) mit ausführlichen Diagnose-Kenngrößen, einschließlich geschichteter Analysen und Grafiken der Survival-Funktion für benutzerspezifizierte Werte der Prädiktor-Variablen. Für die Cox-Regression kann der Benutzer die Stichprobe schichten, um verschiedene Grundlinienfunktionen (baseline hazards) und Koeffizientenvektoren in verschiedenen Schichten behandeln zu können. Darüber hinaus stehen Funktionen für die Definition einer oder mehrerer zeitabhängiger Kovariablen zur Verfügung. Diese zeitabhängigen Kovariablen können mit Hilfe eines flexiblen Formelinterpreters definiert werden, der es dem Benutzer ermöglicht, die Kovariablen über arithmetische Ausdrücke zu spezifizieren, die sowohl die Zeit als auch logische Funktionen (z.B. timdep=age+age*log(t)*(age>45), wobei t die Zeit beschreibt) sowie Verteilungsfunktionen enthalten können. Wie in allen anderen Modulen von STATISTICA auch kann der Benutzer auf die technischen Parameter aller Verfahren zugreifen, um diese ggf. zu verändern. Das Modul enthält schließlich eine umfassende Auswahl an Grafiken und speziellen Diagrammen, um die Interpretation der Ergebnisse zu unterstützen, wie z.B. Plots der Survival-Funktion, Muster der zensierten Daten, Hazard- und kumulierte Hazard-Funktionen, Wahrscheinlichkeitsdichten, Plots zum Vergleich von Gruppen, Plots zur Verteilungsanpassung, verschiedene Residuenplots und viele weitere. Für ingenieurtechnische Anwendungen siehe auch Weibull-Analyse.
- Allgemeine nicht-lineare Regression
Das Modul Nichtlineare Regression ermöglicht dem Benutzer die Anpassung beliebiger Typen nichtlinearer Modelle. Eine der speziellen Eigenschaften dieses Moduls besteht darin, dass – im Unterschied zu traditionellen Programmen der nichtlinearen Regression – die Größe der Datendatei keine Rolle spielt.
- Schätzmethoden. Die Modelle können unter Verwendung von KQ- oder Maximum-Likelihood-Schätzverfahren bzw. basierend auf benutzerdefinierten Verlustfunktionen angepasst werden. Auf der Basis des Kleinste-Quadrate-Kriteriums lassen sich der hocheffiziente Levenberg-Marquardt- und der Gauss-Newton-Algorithmus zur Parameterschätzung für beliebige lineare und nichtlineare Regressionsprobleme einsetzen. Für große Datensätze oder schwierige nichtlineare Regressionsprobleme auf der Basis Kleinster Quadrate ist dies die empfohlene Methode zur Berechnung präziser Parameterschätzwerte. Der Benutzer kann aus vier leistungsfähigen Optimierungsverfahren zur konkreten Parameterschätzung auswählen: Quasi-Newton, Simplex, Koordinatensuche nach Hooke-Jeeves sowie Rosenbrock-Suchverfahren der rotierenden Koordinaten. Damit erhält man stabile Parameterschätzungen in nahezu allen Fällen, selbst bei numerisch anspruchsvollen Problemen.
- Modelle. Der Benutzer kann die Modellgleichung einfach dadurch spezifizieren, dass er die Gleichung in einem speziellen Editor eingibt. Die Gleichungen können logische Operatoren enthalten, wodurch es möglich wird, unstetige, d.h. stückweise definierte, Regressionsmodelle und Modelle mit Indikatorvariablen zu spezifizieren. In den Gleichungen kann auf eine breite Auswahl von Verteilungen Bezug genommen werden. Dazu gehören Beta-, Binomial-, Cauchy-, Chi-Quadrat-, Exponential-, Extremwert-, F-, Gamma-, Geometrische, Laplace-, Logistische, Normal-, Lognormal-, Pareto-, Poisson-, Rayleigh-, Students t- sowie Weibull-Verteilung (Dichte- bzw. Wahrscheinlichkeitsfunktion, Verteilungsfunktion und deren Inverse). Der Benutzer kann alle Aspekte des Schätzverfahrens, wie z.B. Startwerte, Schrittweiten, Konvergenzkriterien, in vollem Umfang kontrollieren. Die am häufigsten benötigten Regressionsmodelle sind im Modul Nichtlineare Regression vordefiniert und können einfach als Menüoptionen abgerufen werden. Diese Modelle schließen schrittweise Probit- und Logit-Regression, das exponentielle Regressionsmodell und stückweise lineare Regression (mit Strukturbruch) ein. Zu beachten ist, dass STATISTICA auch Implementierungen mächtiger Algorithmen zur Anpassung von verallgemeinerten linearen Modellen enthält, einschließlich Probit und multinomialer Logit-Modelle, sowie verallgemeinerte additive Modelle.
- Ergebnisse. Zusätzlich zu verschiedenen deskriptiven Statistiken enthält die Standardausgabe die Parameterschätzungen, deren Standardfehler, die unabhängig von den Schätzungen selbst berechnet werden, die Kovarianzmatrix der Parameterschätzungen, die Prognosewerte, Residuen und Maße für die Anpassungsgüte (z.B. die Log-Likelihood der geschätzten/Nullmodelle und den Chi-Quadrat-Test der Differenz an erklärter Varianz, Klassifikation der Fälle und Odds-Ratios für Logit- und Probit-Modelle). Die Prognosewerte und die Residuen können der Datendatei für weitere Analysen hinzugefügt werden. Für Probit- und Logit-Modelle wird der Gewinn bzw. Verlust an Anpassung automatisch berechnet, wenn Parameter dem Modell hinzugefügt oder aus diesem entfernt werden, d.h. der Benutzer kann die Modelle anhand schrittweiser nichtlinearer Verfahren an die Daten erkunden. Optionen zur automatischen schrittweisen Regression (vorwärts und rückwärts) sowie Beste-Subset-Auswahl von Prädiktoren in Logit- und Probit-Modellen werden im Modul Verallgemeinerte Lineare/Nichtlineare Modelle angeboten.
- Grafiken. In die Ausgabe der Ergebnisse ist eine umfassende Auswahl von Grafiken integriert. Dazu gehören 2D- und 3D-Flächenplots, die dem Benutzer die Güte der Anpassung verdeutlichen und die Identifikation von Ausreißern ermöglichen. Der Benutzer kann interaktiv die Gleichung der angepassten Funktion korrigieren, ohne die Daten neu verarbeiten zu müssen, und nahezu alle Aspekte des Schätzprozesses visualisieren. Viele weitere spezielle Grafiken dienen der Bewertung der Güte der Anpassung und der Visualisierung der Ergebnisse, wie z.B. Histogramme aller ausgewählten Variablen und der Residuen, Scatterplots der Beobachtungswerte gegen die Prognosewerte sowie Prognosewerte gegen Residuen, einfache und einseitige Normalverteilungsplots der Residuen und weitere.
- Loglineare Analyse
Dieses Modul enthält eine vollständige Implementation von Verfahren der Modellierung loglinearer Ansätze für mehrdimensionale Häufigkeitstabellen. Zu beachten ist, dass STATISTICA auch das Modul Verallgemeinerte Lineare/Nichtlineare Modelle enthält, welches Optionen zur Analyse von binomialen und multinomialen Logit-Modellen mit kodierten ANOVA/ANCOVA-ähnlichen Designs anbietet. Das Programm analysiert Tabellen mit bis zu sieben Dimensionen. Sowohl vollständige als auch unvollständige Tabellen mit strukturellen Nullen können analysiert werden. Häufigkeitstabellen können aus Einzeldaten erstellt oder im Programm direkt eingegeben werden. Das Modul Loglineare Analyse bietet eine umfassende Auswahl von anspruchsvollen Verfahren zur Modellierung in einer interaktiven und flexiblen Umgebung, die explorative und konfirmatorische Analysen selbst komplexer Tabellen in hohem Maße unterstützt. Der Benutzer kann an jeder Stelle der Analyse sowohl die vollständige Tabelle als auch die Marginaltabellen betrachten. Darüber hinaus können die erwarteten Häufigkeiten ausgegeben werden. Die Anpassung aller marginalen und partiellen Assoziationsmodelle kann bewertet werden; es können außerdem spezielle Modelle an die beobachteten Daten angepasst werden. Für die Auswahl des bestangepassten Modells beinhaltet das Programm eine intelligente Prozedur zur automatischen Modellwahl, die zunächst die für die Anpassung erforderliche Ordnung der Interaktionen bestimmt, um anschließend über Rückwärts-Elimination das beste Modell zu finden, das an die Daten hinreichend gut angepasst ist. Die Kriterien für die Güte der Anpassung werden vom Benutzer spezifiziert. Die Standardausgabe beinhaltet u.a. G-Quadrat (Maximum-Likelihood-Chi-Quadrat), die gewöhnliche Pearsonsche Chi-Quadrat-Statistik mit entsprechenden Freiheitsgraden und Signifikanzniveaus, die Tabellen mit den beobachteten und erwarteten Häufigkeiten. Die im Modul Loglineare Analyse verfügbaren Grafikoptionen schließen eine Vielzahl von 2D- und 3D-Grafiken ein, die speziell für die Visualisierung von zwei- und mehrdimensionalen Häufigkeitstabellen konzipiert wurden, z.B. interaktive, benutzerkontrollierte Stapel von Histogrammen in Kategorien und 3D-Histogrammen, die Schichten der mehrdimensionalen Tabellen darstellen, Plots von beobachteten und erwarteten Häufigkeiten, Plots verschiedener Residuen (standardisiert, Komponenten der Maximum-Likelihood-Chi-Quadrat-Statistik, Freeman-Tukey-Reste ) und weitere.
- Zeitreihenanalyse / Prognose
Das Modul Zeitreihen enthält eine ganze Reihe von verschiedenen Verfahren: deskriptive Verfahren, Modellierung, Zerlegung und Prognose sowohl für Modelle in der Zeit als auch für Modelle im Frequenzbereich. Alle diese Prozeduren sind integriert, d.h. dass die Ergebnisse einer Analyse, z.B. die Residuen eines ARIMA-Modells, direkt in der folgenden Analyse verwendet werden können, um z.B. die Autokorrelation der Residuen zu berechnen. Außerdem stehen flexible Optionen für die grafische Darstellung einzelner oder mehrerer Zeitreihen zur Verfügung. Im aktiven Arbeitsbereich können mehrere Reihen, z.B. aus der Eingabe oder verschiedenen Stadien der Analyse, verwaltet werden; diese Zeitreihen können betrachtet und verglichen werden. Das Programm verfolgt automatisch aufeinanderfolgende Analysen und verwaltet ein Protokoll der Transformationen und weiterer Ergebnisse, wie z.B. ARIMA-Residuen, Saison-Komponenten Der Benutzer kann folglich stets zu vorangegangenen Transformationen zurückkehren oder die Originalreihe mit ihren Transformationen, z.B. anhand von Plots, vergleichen. Informationen über die Transformationen werden in Form von langen Variablen-Labels abgelegt, so dass beim Speichern der neu erzeugten Variablen die gesamte "Vorgeschichte" der Zeitreihe erhalten bleibt. Die speziellen Verfahren des Moduls Zeitreihen werden in den folgenden Unterabschnitten beschrieben.
- Transformationen, Modellierung, Plots, Autokorrelationen. Die verfügbaren Transformationen ermöglichen dem Benutzer die vollständige Untersuchung von Mustern in der eingegebenen Zeitreihe und die Durchführung aller gebräuchlichen Transformationen von Zeitreihen einschließlich: Trendbereinigung, Elimination von Autokorrelationen, Glättung über gleitende Mittel (ungewichtet und gewichtet, mit benutzerdefinierten oder Daniell-, Tukey-, Hamming-, Parzen- oder Bartlett-Gewichten), Glättung anhand gleitender Mediane, einfaches exponentielles Glätten (siehe auch die Beschreibung aller Optionen des exponentiellen Glättens weiter unten), Differenzieren, Integrieren, Residuenbildung, Shifting, 4253H-Filter, Tapering, Fourier- (und inverse) Transformationen und weitere. Analysen der Autokorrelation, der partiellen Autokorrelation und der Kreuzkorrelation können außerdem durchgeführt werden.
- ARIMA und Zeitreihen mit Strukturbruch, Interventionsanalyse. Das Modul Zeitreihen bietet eine vollständige Implementation von ARIMA-Verfahren. Die Modelle können eine Konstante enthalten und die Reihe kann vor dem Beginn der Analyse transformiert werden. Diese Transformationen werden automatisch "rückgängig" gemacht, nachdem die ARIMA-Prognosen berechnet wurden, so dass die Prognosen und deren Standardfehler in Abhängigkeit von den Werten der Originalreihe beschrieben werden. Es können approximative und exakte bedingte Maximum-Likelihood-Quadratsummen berechnet werden. Die ARIMA-Implementation im Modul Zeitreihen ist speziell für die Anpassung von Modellen mit langen Saisonperioden (z.B. Perioden von 30 Tagen) ausgelegt. Die Standardausgabe umfasst die Parameterschätzungen, deren Standardfehler und die Korrelationen der Parameter. Weiter können Prognosen und deren Standardfehler berechnet, geplottet und an die Datendatei angefügt werden. Darüber hinaus stehen zahlreiche Optionen für die Untersuchung der ARIMA-Residuen zur Verfügung, einschließlich einer großen Auswahl an Grafiken. Die Implementation von ARIMA im Modul Zeitreihen erlaubt dem Benutzer die Behandlung von Zeitreihen mit Strukturbruch (Interventionsanalyse). Verschiedene gleichzeitig auftretende Interventionen können modelliert werden, die entweder einparametrische abrupt-permanente Interventionen, zweiparametrische graduelle oder temporäre Interventionen darstellen können. Für die Betrachtung der verschiedenen Wirkungsmuster können Grafiken herangezogen werden. Prognosen können für alle Interventionsmodelle berechnet werden, die anschließend sowohl grafisch dargestellt als auch an die Datendatei angefügt werden können.
- Exponentielles Glätten mit und ohne Saisonkomponente. Das Modul Zeitreihen enthält eine vollständige Implementation aller zwölf gebräuchlichen Modelle zur exponentiellen Glättung. Für die Modelle kann eine additive oder multiplikative Saison-Komponente und/oder ein linearer, exponentieller oder gedämpfter Trend spezifiziert werden; folglich sind auch die häufig verwendeten Holt-Winter-Modelle mit linearem Trend enthalten. Der Benutzer kann den Startwert für die geglättete Reihe, den Startwert für den Trend und ggf. Startwerte für die Saison-Faktoren spezifizieren. Außerdem kann der Benutzer eine Gittersuche im Parameterraum veranlassen, um die optimalen Glättungsparameter zu bestimmen. Die Tabellen mit den Ergebnissen der Suche enthalten den mittleren Fehler, den mittleren absoluten Fehler, die Summen der Quadrate für den Fehler, den mittleren quadratischen Fehler, den mittleren prozentualen Fehler und den mittleren absoluten prozentualen Fehler für alle Kombinationen der Parameterwerte. Der kleinste Werte dieser Indizes wird in der Ergebnistabelle markiert. Darüber hinaus kann der Benutzer eine automatische Suche nach den besten Parametern in Bezug auf den mittleren quadratischen Fehler, den mittleren absoluten Fehler oder den mittleren absoluten prozentualen Fehler anfordern. Für diese Minimumsuche steht ein allgemeines Optimierungsverfahren zur Verfügung. Die Ergebnisse des jeweiligen exponentiellen Glättens, die Residuen und die geforderte Anzahl an Prognosen, stehen für weitere Analysen und Plots bereit. Ein zusammenfassender Plot dient der Bewertung der Adäquatheit des jeweiligen Modells der exponentiellen Glättung; dieser Plot zeigt die Originalreihe gemeinsam mit den geglätteten Werten und Prognosen, während die Residuen separat gegen die rechte Y-Achse geplottet werden.
- Klassische Saisonbereinigung (Census I-Methode). Der Benutzer kann die Länge der Saison-Periode spezifizieren und zwischen dem additiven oder multiplikativen Saison-Modell wählen. Das Programm berechnet gleitende Mittelwerte, Quotienten oder Differenzen, Saison-Faktoren, die saisonbereinigte Reihe, den geglätteten Trend-Zyklus und die irreguläre Komponente. Diese Komponenten stehen für weitere Analysen zur Verfügung; so können z.B. Histogramme, Normalverteilungsplots für ausgewählte oder alle Komponenten erstellt werden, um die Adäquatheit des Modells zu überprüfen.
- X11-Verfahren zur Saisonbereinigung für Monate und Quartale (Census II-Methode). Das Modul Zeitreihen enthält die vollständige Implementation einer X11-Variante des US Bureau of the Census der Census II-Methode zur Saisonbereinigung. Obwohl der ursprüngliche X-11-Algorithmus nicht Jahr-2000-kompatibel war (nur Daten bis vor Januar 2000 konnten analysiert werden), kann die STATISTICA-Implementierung von X11 sowohl Daten vor als auch nach dem 1. Januar 2000 behandeln. Die Anordnung der Dialoge und Optionen ist an die Definitionen und Konventionen angelehnt, die in der Dokumentation des Bureau of the Census beschrieben sind. Es können additive und multiplikative Saison-Modelle spezifiziert werden. Der Benutzer kann außerdem Faktoren für Arbeitstage und die Saisonbereinigung spezifizieren. Die Variabilität aufgrund der Arbeitstage kann mittels Regression geschätzt und zur Bereinigung der Reihe eingesetzt werden. Für die Bewertung extremer Beobachtungen, für die Berechnung der Saison-Faktoren und der Trend-Zyklus-Komponente stehen die Standard-Optionen zur Verfügung. Der Benutzer kann dabei aus verschiedenen Typen gleitender Mittel auswählen; wobei die optimale Länge und der Typ des gleitenden Mittels vom Programm auch automatisch gewählt werden kann. Die Komponenten der Bereinigung (Saison, Trend-Zyklus, irregulär) und die saisonbereinigte Reihe stehen für weitere Analysen und Plots zur Verfügung. Diese Komponenten können für weitere Analysen in anderen Programmen gespeichert werden. Das Programm erstellt Plots der verschiedenen Komponenten, einschließlich Plots in Kategorien für Monate oder Quartale.
- Polynomial-Distributed-Lags-Analyse. Die Implementation der Distributed-Lags-Verfahren im Modul Zeitreihen schätzt sowohl Modelle mit unrestringierten Lags (zeitverschobenen Werten) als auch Modelle für (restringierte) Distributed Lags nach Almon. Für die Untersuchung der Verteilungen der Variablen des Modells steht eine Auswahl von Grafiken zur Verfügung.
- Spektralanalyse (Fourier-Analyse) und Kreuzspektralanalyse. Das Modul Zeitreihen enthält eine vollständige Implementation von Verfahren der Spektralanalyse (Fourier-Zerlegung) und Kreuzspektralanalyse. Das Programm ist speziell für die Analyse auch ungewöhnlich langer Zeitreihen mit z.B. über 250 000 Beobachtungen ausgelegt. Es werden keinerlei Bedingungen an die Länge der Reihe gestellt; die Länge der Reihe muss beispielsweise keine Potenz von 2 sein. Der Benutzer kann sich jedoch auch für Padding (Anfügen von Nullen am Ende) oder Abschneiden der Reihe entscheiden. Die vor der Analyse durchführbaren Standard-Transformationen beinhalten Tapering, Subtraktion des Mittelwertes und Trendbereinigung. Bei einfacher Spektralanalyse beinhalten die Ergebnisse Frequenzen, Perioden, Sinus- und Kosinus-Koeffizienten, Werte des Periodogramms und Spektraldichteschätzungen. Die Dichteschätzungen können anhand von vordefinierten Datenfenstern (Daniell, Hamming, Bartlett, Tukey, Parzen) oder benutzerdefinierten Datenfenstern gewonnen werden. Für besonders lange Reihen steht eine nützliche Option zur Verfügung. Diese Option veranlasst, dass nur eine benutzerdefinierte Anzahl der größten Periodogramm- oder Dichtewerte in absteigender Reihenfolge angezeigt wird. So können die größten Peaks in Periodogramm oder Spektraldichte bei langen Zeitreihen leichter identifiziert werden. Der Benutzer kann den Kolmogorov-Test für die Werte des Periodogramms anfordern, um zu testen, ob diese Werte exponentialverteilt sind, d.h. ob die Originalreihe ein weißes Rauschen darstellt. Zahlreiche Plots stehen zur Visualisierung der Ergebnisse zur Verfügung; es können die Sinus- und Kosinus-Koeffizienten, die Werte von Periodogramm, Log-Periodogramm, Spektraldichte und Log-Dichte gegen die Frequenzen, Perioden oder Log-Perioden geplottet werden. Für lange Zeitreihen kann der Benutzer das Segment (die Periode) auswählen, für das Periodogramm oder Spektraldichte darzustellen sind, wodurch die "Auflösung" des jeweiligen Plots erhöht wird. Bei der Kreuzspektralanalyse werden zu den Ergebnissen der einfachen Spektralanalyse für jede einzelne Reihe Kreuz-Periodogramm (Real- und Imaginärteil), Kospektraldichte, Quadraturspektrum, Kreuz-Amplitude, Kohärenzwerte, Gainwerte und das Phasenspektrum ausgegeben. Alle diese Statistiken können gegen die Frequenz, Periode oder Log-Periode geplottet werden; entweder für alle Perioden (Frequenzen) oder nur für einen benutzerdefinierten Ausschnitt. Eine benutzerdefinierte Anzahl der größten Werte des Kreuz-Periodogramms (real oder imaginär) kann in einer Ergebnistabelle in absteigender Ordnung dargestellt werden, um die größten Peaks bei der Auswertung langer Zeitreihen leichter identifizieren zu können. Wie bei allen Prozeduren des Moduls Zeitreihen auch können die resultierenden Zeitreihen dem aktiven Arbeitsbereich hinzugefügt werden, wodurch sie für weitere Analysen mit anderen Verfahren der Zeitreihenanalyse oder anderen Modulen von STATISTICA verfügbar sind.
- Verfahren zur Prognose auf Regressionsbasis. Schließlich bietet STATISTICA Verfahren der Zeitreihenanalyse, die auf Verfahren der Regressionsanalyse basieren (einschließlich Regression durch den Ursprung, nichtlinearer Regression und interaktiver Was-wäre-wenn-Prognose).
- Modellierung von Strukturgleichungen und Pfadanalyse (SEPATH)
STATISTICA enthält eine umfassende Implementation von Verfahren zur Modellierung von Strukturgleichungen, die von einer flexiblen Funktionalität zur Durchführung von Monte Carlo-Studien ergänzt wird (SEPATH). Das Modul SEPATH ist ein "State-of-the-Art"-Programm mit einer intelligenten Benutzeroberfläche. Es bietet eine umfassende Auswahl von Modellierungsverfahren, wobei die Spezifikation selbst komplexer Modelle ohne Verwendung einer Befehlssyntax möglich ist. Mit Hilfe der Assistenten und des Pfadedítors können Sie die Analyse in einfacher Weise unter Verwendung von Menüs und Dialogen spezifizieren; die Beherrschung einer "Sprache" ist, anders als bei anderen Programmen zur Modellierung von Strukturgleichungen, nicht erforderlich. SEPATH stellt eine vollständige Implementation dar, die zahlreiche fortgeschrittene Verfahren enthält. Das Programm kann Matrizen von Korrelationen, Kovarianzen und Momenten (strukturelle Mittelwerte, Modelle mit Konstanten) analysieren. Alle Modelle können mit Hilfe des Pfad-Assistenten, des Faktorenanalyse-Assistenten und des Pfadeditors spezifiziert werden; diese Funktionalitäten arbeiten sehr effektiv und ermöglichen es dem Benutzer, selbst komplexe Modelle in wenigen Minuten zu spezifizieren, indem in den jeweiligen Dialogen eine Auswahl getroffen wird. Das Modul SEPATH berechnet, unter Verwendung von Verfahren zur Optimierung unter Nebenbedingungen, die jeweiligen Standardfehler für standardisierte Modelle und für Modelle, die an Korrelationsmatrizen angepasst wurden. Die Ergebnisse beinhalten sowohl einen umfangreichen Satz von Diagnose-Kenngrößen, einschließlich der Standardindizes für die Güte der Anpassung als auch Nichtzentralitäts-Indizes, die auf jüngste Untersuchungen auf dem Gebiet der Modellierung von Strukturgleichungen zurückgehen. Der Benutzer kann Modelle an mehrere Stichproben (Gruppen) anpassen, wobei für jede Gruppe feste, freie oder restringierte (identisch über die Gruppen) Parameter spezifiziert werden können. Die Analyse von Moment-Matrizen ermöglicht Ihnen das Programm das Testen komplexer Hypothesen über strukturelle Mittelwerte in verschiedenen Gruppen. Die Dokumentation des Moduls SEPATH enthält zahlreiche detaillierte Beschreibungen von Beispielen aus der Literatur zur Konfirmatorischen Faktorenanalyse, zur Pfadanalyse, zu Modellen zur Testtheorie für Sets von Congeneric Tests, zu einem Multi-Trait Multi-Method Modell, zur longitudinalen Faktorenanalyse, zu Tests auf verbundene Symmetrie, strukturellen Mittelwerten und zu weiteren Themen.
SEPATH Monte Carlo-Studien. Das Modul Modellierung von Strukturgleichungen (SEPATH) enthält leistungsstarke Optionen zur Durchführung von Monte Carlo-Experimenten: Der Benutzer kann Datensätze für vordefinierte Modelle generieren und speichern, die auf normalen oder schiefen Verteilungen basieren. Es können sowohl Bootstrap-Schätzungen berechnet als auch Verteilungen für verschiedene Diagnose-Kenngrößen, Parameterschätzungen usw. anhand von Monte Carlo-Experimenten bestimmt werden. Darüber hinaus stehen zahlreiche Grafikoptionen zur Visualisierung der Ergebnisse zur Verfügung.
- Allgemeine Lineare Modelle (ALM)
STATISTICA Allgemeine Lineare Modelle (ALM) analysiert Wirkungen von kategorialen oder stetigen unabhängigen Variables auf eine oder mehrere stetige abhängige Variablen. ALM ist nicht nur das hochentwickeltste der gegenwärtig auf dem Markt verfügbaren ALM-Werkzeuge, sondern auch das umfassenste mit breiten Anwendungsmöglichkeiten. Es enthält ein große Auswahl von Optionen, Grafiken, begleitet von Statistiken und ausgedehnten Diagnosewerkzeugen. ALM bietet ein breites Spektrum von Optionen zur Handhabung von sogenannten "kontroversen Problemen", für die es keine übereinstimmende Lösung gibt. ALM berechnet alle Standardergebnisse, einschließlich ANOVA-Tabellen mit univariaten und multivariaten Tests, deskriptiven Statistiken, usw. ALM bietet viele Optionen für Ergebnisse und Grafiken, die in anderen Programmen zumeist nicht verfügbar sind. Darüber hinaus bietet ALM einfache Wege zum Test von Linearkombinationen von Parameterschätzwerten, Spezifikationen von benutzerdefinierten Fehlertermen und Effekten, umfassende Verfahren von Post-Hoc-Vergleichen für Zwischengruppeneffekte und Messwiederholungseffekte sowie deren Interaktionen.
- Allgemeine Regressionsmodelle (ARM)
STATISTICA Allgemeine Regressionsmodelle (ARM) bietet dem Anwender eine hochflexible Implementierung der Optionen für Standardergebnisse und spezielle Ergebnisse im allgemeinen linearen Modell, ebenso wie einen umfassenden Satz von Verfahren der schrittweisen Regression und des besten Subsets zur Modellentwicklung für Effekte von stetigen und kategorialen Prädiktorvariablen. Das "Allgemein" in Allgemeine Regressionsmodelle bezieht sich also sowohl auf den Einsatz des allgemeinen linearen Modells, als auch auf die Aufhebung der Beschränkung auf Analysen von Designs mit stetigen Prädiktorvariablen, welcher die meisten anderen Programme zur schrittweisen Regression unterliegen. Außerdem enthält ARM spezielle Ergebnisoptionen für Regressionsanalysen wie Paretodiagramme von Parameterschätzwerten, Gesamtmodelltests mit diversen Verfahren zur Bestimmung von Modellen ohne Achsenabschnitt, partielle und semi-partielle Korrelation, usw.
- Verallgemeinerte Lineare/Nichtlineare Modelle (VLM)
Die Verallgemeinerten Linearen/Nichtlinearen Modelle (VLM) dienen zum Aufspüren von linearen und nichtlinearen Beziehungen zwischen einer Wirkungsvariablen und kategorialen oder stetigen Prädiktorvariablen. Zu den spezielle Anwendungen der verallgemeinerten linearen Modelle zählen die binomiale und multinomiale Logit-Regression und die Probit-Regression oder Signalerfassungsmodelle. Das Modul VLM wird Statistiken für alle Standardergebnisse berechnen, einschließlich Likelihood-Ratio-Tests, sowie Wald- und Score-Tests für signifikante Effekte, Parameterschätzwerte samt ihren Standardfehlern und Konfidenzintervallen, usw. Die Benutzeroberflächen und Verfahren zur Designspezifikation entsprechen denen in ALM, ARM und PKQ. Der Benutzer kann auf einfache Weise beispielsweise ANOVA- oder ANCOVA-ähnliche Designs, Wirkungsflächendesigns, Simplexdesigns für Mischungen spezifizieren. Somit dürften auch Neueinsteiger keine Schwierigkeiten in der Anwendung von verallgemeinerten linearen Modelle bei der Analyse ihrer Daten haben. Außerdem enthält VLM eine breite Auswahl von Werkzeugen zur Modellprüfung wie Tabellen und Grafiken für diverse Residualstatistiken und zur Diagnose von Ausreißern, einschließlich roher Residuen, Pearson-Residuen, Deviance-Residuen, studentisierter Pearson-Residuen, studentisierter Deviance-Residuen, Likelihood-Residuen, differenzieller Chi-Quadrat-Statistiken, differentieller Deviance und generalisierter Cook-Distanzen, usw.
- Modelle Partieller Kleinster Quadrate (PKQ)
Modelle Partieller Kleinster Quadrate (PKQ) enthält eine umfassende Auswahl von Algorithmen für univariate und multivariate Probleme der partiellen kleinsten Quadrate. PKQ berechnet alle Standardresultate für Analysen mit partiellen kleinsten Quadraten. Außerdem bietet es viele Ergebnisoptionen und insbesondere Grafikoptionen, die in anderen Implementierungen zumeist nicht enthalten sind. Beispielsweise Grafiken von Parameterwerten als Funktion der Komponentenanzahl, zweidimensionale Plots für alle Ausgabestatistiken (Parameter, Faktorladungen, usw.), zweidimensionale Plots für alle Residualstatistiken, usw. Weil PKQ eine den ALM, ARM und VLM entsprechende flexible Benutzeroberfläche bietet, können auf einfache Weise in einem Modul bestimmte Modelle entwickelt und danach in PLS ausgewertet werden. Diese einzigartige Flexibilität ermöglicht auch Neueinsteigern den Einsatz dieser mächtigen Verfahren bei der Analyse ihrer Daten. Die Methode partieller kleinster Quadrate ist auch ein mächtiges Verfahren für Data-Mining, insbesondere bei der Bestimmung einer kleinen Anzahl von Dimensionen für eine große Anzahl von Prädiktoren und Response-Variablen. Diese Methode zur Analyse von linearen Systemen ist in den letzten Jahren sehr populär geworden, so dass viele der Algorithmen und Statistiken sich noch in der Entwicklung befinden.
|











|
| |
|
|
STATISTICA Explorative Verfahren bietet eine breite Auswahl explorativer Verfahren, von der Clusteranalyse bis zu höheren Methoden wie den Klassifikationsbäumen. Die Verfahren enthalten viele Werkzeuge der interaktiven Visualisierung zur Exploration von Beziehungen und Mustern in Daten sowie ein integriertes Visual Basic-Skripting. STATISTICA Explorative Verfahren umfasst folgende Teilmodule:
- Clusteranalyse
Dieses Modul enthält eine umfassende Implementation von Methoden zur Clusterung (k-Means, hierarchisch, 2-fach agglomerativ). Das Programm kann sowohl Einzeldaten als auch Distanzmatrizen wie z.B. Korrelationsmatrizen verarbeiten. Der Benutzer kann Fälle, Variablen oder beides basierend auf einer Vielzahl von Distanzmaßen [Euklidisch, quadriert Euklidisch, City-block (Manhattan), Chebychev, Power-Distanzen, Prozent Nichtübereinstimmung und 1-Pearsons r] clustern. Als Fusionregeln stehen Single Linkage, Complete Linkage, Weighted und Unweighted Group Average oder Centroid, Ward-Methode und weitere Verfahren zur Verfügung. Die Distanzmatrizen können für weitere Analysen gespeichert werden. Beim k-Means-Verfahren hat der Benutzer die vollständige Kontrolle über die anfänglichen Cluster-Zentren. Dabei können Designs von extremer Größe verarbeitet werden: Die hierarchischen Verfahren können Matrizen von 1000 Variablen oder einer Million Distanzen behandeln. Zusätzlich zu den üblichen Ergebnissen einer Clusteranalyse ist ein breiter Satz deskriptiver Statistiken und Diagnose-Kenngrößen verfügbar. So wird z.B. das vollständige Fusionsprotokoll bei hierarchischen Verfahren oder die ANOVA-Tabelle bei k-Means ausgegeben. Die Information über die Clusterzugehörigkeit kann der Datendatei zur weiteren Bearbeitung angefügt werden. Die Grafikoptionen des Moduls beinhalten Baumdiagramme, diskrete Matrixplots, grafische Darstellungen des Fusionsprotokolls, Plots der Mittelwerte bei k-Means-Verfahren und viele weitere.
- Faktorenanalyse
Das Modul Faktorenanalyse stellt eine umfassende Implementation von Verfahren der Faktorenanalyse bereit, die durch zahlreiche Diagnose-Kenngrößen und eine breite Auswahl analytischer und explorativer Grafiken ergänzt wird. Das Programm führt Hauptkomponentenanalysen, gewöhnliche und hierarchische (schiefwinklige) Faktorenanalyse mit bis zu 300 Variablen durch. Umfangreichere Modelle können im Modul (SEPATH) Structural Equation Modeling and Path Analysis durchgeführt werden, welches im Add-On STATISTICA Höhere Modelle enthalten ist.
- Hauptkomponenten- und Klassifikationsanalyse
STATISTICA enthält auch ein spezielles Programm zur Hauptkomponenten- und Klassifikationsanalyse. Die Ausgaben umfassen die Eigenwerte (gewöhnliche, kumulierte, relative), Faktorladungen, Faktorwerte, die der Eingabedatendatei angefügt werden können (grafisch als Symbole gekennzeichnet und interaktiv rekodiert) sowie eine Anzahl eher technischer Statistiken und Kenngrößen. An Rotationsverfahren stehen Varimax, Equimax, Quartimax, Biquartimax (einfach oder standardisiert) und schiefwinklige Rotationen zur Verfügung. Der Faktorenraum kann geplottet und anhand von 2D- oder 3D-Scatterplots mit gelabelten Variablenpunkten projiziert dargestellt werden. Weitere integrierte Grafiken beinhalten Scree-Plots, verschiedene Scatterplots, Balken- und Linienplots. Nachdem eine Faktorenlösung gefunden wurde, kann der Benutzer die Korrelationsmatrix aus der entsprechenden Anzahl an Faktoren neu berechnen, um die Güte der Anpassung des Faktorenmodells bewerten zu können. Sowohl Einzeldaten als auch Korrelationsmatrizen können als Eingabe für das Verfahren dienen. Konfirmatorische Faktorenanalyse und andere verwandte Analysen können mit Hilfe des Moduls (SEPATH) Structural Equation Modeling and Path Analysis in STATISTICA Höhere Modelle aufgerufen werden, in dem ein spezieller Assistent für die Konfirmatorische Faktorenanalyse Sie Schritt für Schritt durch den Prozess der Spezifikation des Modells führt.
- Kanonische Analyse
Dieses Modul bietet eine umfassende Implementation von Verfahren der kanonischen Analyse und bildet damit eine sinnvolle Ergänzung der in andere Module (ANCOVA / MANCOVA oder Diskriminanzanalyse) integrierten Verfahren. Es können sowohl Einzeldaten als auch Korrelationsmatrizen verarbeitet werden. Im Ergebnis der Analyse werden alle Statistiken der kanonischen Korrelationsanalyse berechnet, wie Eigenwerte, Eigenvektoren, Redundanzkoeffizienten, kanonische Gewichte, Ladungen, extrahierte Varianzen, Signifikanztests für jede Root usw. Dazu wird eine umfangreiche Anzahl von Diagnose-Kenngrößen ausgegeben. Die Scores der kanonischen Variablen können für jeden Fall berechnet, ggf. an die Datendatei angefügt und über integrierte Iconplots veranschaulicht werden. Das Modul beinhaltet außerdem eine Vielzahl integrierter Grafiken (Plots der Eigenwerte, der kanonischen Korrelationen, Scatterplots der kanonischen Variablen und viele weitere). Konfirmatorische Analysen struktureller Beziehungen zwischen latenten Variablen können im Modul SEPATH (Structural Equation Modeling and Path Analysis) in STATISTICA Höhere Modelle durchgeführt werden. Fortgeschrittene Verfahren zur schrittweisen und Beste-Subset-Auswahl von Prädiktorvariablen für MANOVA/MANCOVA-Designs (mit mehreren abhängigen Variablen) sind im Modul Allgemeine Regressionsmodelle (ARM) in STATISTICA Höhere Modelle verfügbar.
- Reliabilitäts- und Itemanalyse
Dieses Modul beinhaltet eine umfassende Auswahl von Verfahren für die Entwicklung und Bewertung von Umfragen und Fragebögen. Wie in allen anderen Modulen von STATISTICA, können hier extrem große Designs analysiert werden. Der Benutzer kann Statistiken der Reliabilität für alle Items einer Skala berechnen, interaktiv Teilmengen auswählen oder Vergleiche zwischen Teilmengen von Items anstellen, indem die Verfahren "Split-Half" oder "Split-Part" eingesetzt werden. In einem einzigen Run kann der Benutzer sowohl die Reliabilität einer Summenskala als auch die von Subskalen bewerten. Werden Items interaktiv eliminiert, wird sofort die neue Reliabilität berechnet, ohne dass die Datendatei nochmals verarbeitet werden muss. Die Ausgabe beinhaltet Korrelationsmatrizen und deskriptive Statistiken für die Items, Cronbachs Alpha, das standardisierte Alpha, die mittlere Inter-Item-Korrelation, die vollständige ANOVA-Tabelle für die Skala, den vollständigen Satz der Item-Gesamt-Statistik (einschließlich multipler Item-Gesamt R’s), die Split-Half-Reliabilität und die Korrelation zwischen den beiden Listen mit Abschwächungskorrektur. Eine Reihe von Grafiken, einschließlich verschiedener integrierter Scatterplots, Histogramme und Linienplots, sowie eine Auswahl an interaktiven Was-wäre-wenn-Prozeduren unterstützt die Entwicklung der Skalen. So kann der Benutzer beispielsweise die erwartete Reliabilität berechnen, wenn eine bestimmte Anzahl von Items der Skala hinzugefügt würde. Auf diese Weise kann die Anzahl der für das Erreichen einer bestimmten Reliabilität der Skala hinzuzufügenden Items geschätzt werden. Außerdem kann der Benutzer die abschwächungskorrigierte Korrelation (aufgrund nicht vollständiger Reliabilität der Messungen) zwischen der aktuellen Skala (bei gegebener aktueller Reliabilität) mit einem externen Kriterium (bei gegebener benutzerdefinierter Reliabilität) schätzen.
- Klassifikations- und Regressionsbäume
Das Modul Klassifikations- und Regressionsbäume bietet eine umfassende Implementation der aktuellsten Algorithmen für die effektive Erstellung und für das Testen der Robustheit von Klassifikationsbäumen. Ein Klassifikationsbaum ist eine Regel für die Prognose der Klassenzugehörigkeit eines Objektes aus den Werten seiner Prädiktor-Variablen. Höhere Methoden für Klassifikationsbäume, einschließlich flexibler Optionen zur Modellentwicklung und interaktive Werkzeuge zur Exploration von Bäumen sind ebenso in General Classification and Regression Tree Models (GTrees) und General CHAID (Chi-square Automatic Interaction Detection) enthalten. Klassifikationsbäume können auf der Basis von kategorialen oder ordinalen Prädiktor-Variablen erstellt werden. Dabei können sowohl univariate als auch multivariate Splits oder Linearkombinationen von Splits eingesetzt werden. Die Optionen der Analyse enthalten die Durchführung von umfassenden Splits (exhaustive splits, wie in THAID und CART™) oder auf Diskrimination basierende Splits; unverzerrte (unbiased) Variablenauswahl (wie in QUEST); direkte Stopregeln (direct stopping rules, wie in FACT) oder "Aufwärtsabschneiden" (bottom-up pruning, wie in CART); Abschneiden basierend auf Fehlklassifikationsraten oder der "Deviance"-Funktion; verallgemeinerte Chi-Quadrat-, G-Quadrat- oder Gini-Index-Maße für die Güte der Anpassung. Priors und Fehlklassifikationskosten können als identisch spezifiziert, aus den Daten geschätzt oder benutzerspezifiziert werden. Der Benutzer kann außerdem den v-Wert für v-fache Kreuzvalidierung während der Baumerstellung, den v-Wert für v-fache Kreuzvalidierung für die Fehlerschätzung, die Größe der SE-Regel, die minimale Knotengröße vor dem Abschneiden, Startwerte für die Zufallszahlengenerierung und Alpha-Werte für die Variablenselektion spezifizieren. Für die Unterstützung der Analysen stehen integrierte Grafikoptionen zur Verfügung.
- Korrespondenzanalyse
Dieses Modul bietet eine vollständige Implementation von Verfahren der einfachen und multiplen Korrespondenzanalyse, wobei auch Tabellen extremer Größe analysiert werden können. Das Programm akzeptiert als Input für die Analyse Datendateien mit Gruppierungs- (Code-)Variablen für die Berechnung von Kontingenztabellen. Zulässig sind auch Datendateien mit Häufigkeiten (bzw. anderen Korrespondenz-, Assoziations-, Ähnlichkeitsmaßen ) und Kodierungsvariablen zur Kennzeichnung der Zellen in der Tabelle. Darüber hinaus werden außerdem Datendateien akzeptiert, die nur Häufigkeiten (oder andere Korrespondenzmaße) enthalten. Hierbei kann man direkt eine Häufigkeitstabelle eingeben und analysieren lassen. Für die multiple Korrespondenzanalyse kann auch direkt eine Burt-Tabelle für die Eingabe spezifiziert werden. Das Programm berechnet verschiedene Tabellen: Zeilen-Prozente, Spalten-Prozente, Gesamt-Prozente, erwartete Werte, beobachtete minus erwartete Werte, standardisierte Abweichungen und Beiträge zum Chi-Quadrat-Wert. Diese Statistiken können in 3D-Histogrammen grafisch dargestellt und mit Hilfe der Funktion Schichtweise Animation betrachtet werden. Das Modul Korrespondenzanalyse berechnet die verallgemeinerten Eigenwerte und Eigenvektoren und liefert als Ergebnisse außerdem alle üblichen Diagnose-Kenngrößen wie Singulärwerte, Eigenwerte und prozentuale Anteile an der Trägheit für jede Dimension. Sie können entweder manuell die Anzahl der Dimensionen wählen oder einen "Cut-off-Wert" für den maximalen kumulierten Prozentanteil der Trägheit festlegen. Das Programm berechnet die standardisierten Koordinatenwerte für alle Zeilen- und Spaltenpunkte. Sie haben bei der Standardisierung die Wahl zwischen den Optionen Zeilenprofile, Spaltenprofile, Zeilen- und Spaltenprofile und Kanonisch. Für jede Dimension und jeden Zeilen- oder Spaltenpunkt berechnet das Programm Trägheit, Qualität und Kosinus²-Werte. Außerdem können Sie sich in Ergebnistabellen die Matrizen der verallgemeinerten Singulärvektoren anzeigen lassen. Wie bei allen anderen Ergebnistabellen kann auf diese Werte mit Hilfe von STATISTICA Visual Basic zugegriffen werden, um beispielsweise eine nicht übliche Methode zur Berechnung der Koordinaten zu verwenden. Sie können Koordinatenwerte und zugehörige Statistiken (Qualität und Kosinus²-Werte) für ergänzende Punkte (Zeile oder Spalte) berechnen lassen und die Ergebnisse mit den regulären Zeilen- und Spaltenpunkten vergleichen. Ergänzende Punkte können auch für eine multiple Korrespondenzanalyse spezifiziert werden. Neben den 3D-Histogrammen, die für alle Tabellen berechnet werden können, ist auch die Erzeugung eines Linienplots für die Eigenwerte und die Erzeugung von 1D-, 2D- und 3D-Plots für die Zeilen- oder Spaltenpunkte möglich. Zeilen- und Spaltenpunkte können auch in einer gemeinsamen Grafik kombiniert werden - zusammen mit möglichen ergänzenden Punkten. Jeder Punkttyp besitzt eine andere Farbe und Markierung, so dass verschiedene Punkttypen in den Plots leicht identifizierbar sind. Alle Punkte erhalten Labels. Hierzu ist eine Option verfügbar, mit der die Namen für die Punkte auf eine benutzerdefinierte Anzahl von Zeichen gestutzt werden können.
- Multidimensionale Skalierung
Das Modul Multidimensionale Skalierung beinhaltet eine vollständige Implementation der nichtmetrischen Multidimensionalen Skalierung. Hier können Matrizen mit Ähnlichkeiten, Unähnlichkeiten oder Korrelationen analysiert werden, wobei bis zu neun Dimensionen spezifiziert werden können. Die Start-Konfiguration kann entweder vom Programm über eine Hauptkomponentenanalyse berechnet oder vom Benutzer spezifiziert werden. Das Programm verwendet ein iteratives Verfahren zur Minimierung des Stress-Wertes und des Unschärfemaßes (coefficient of alienation). Der Benutzer kann den Iterationsprozess überwachen und die Veränderungen in diesen zu minimierenden Werten beobachten. Die Endkonfigurationen können sowohl in Ergebnistabellen als mittels 2D- und 3D-Scatterplots des Raumes der Dimensionen mit durch Labels gekennzeichneten Item-Punkten ausgewertet werden. Die Ausgabe beinhaltet darüber hinaus die Werte für den Stress (raw F), Kruskals Stress-Koeffizient S und das Unschärfemaß (coefficient of alienation). Die Güte der Anpassung kann anhand von Shepard-Diagrammen (d-Dach und d-Stern) bewertet werden. Wie in STATISTICA üblich kann die Endkonfiguration in einer Datendatei gespeichert werden.
- Diskriminanzanalyse
Das Modul Diskriminanzanalyse enthält eine vollständige Implementation der multiplen schrittweisen Analyse von Diskriminanzfunktionen. STATISTICA enthält auch das Modul Allgemeine Diskriminanzanalytische Modelle (ADM). (unten) zur Anpassung von ANOVA/ANCOVA-ähnlichen Designs mit kategorialen abhängigen Variablen und zur Durchführung vieler fortgeschrittener Analyseformen (z.B. Beste-Subset-Auswahl von Prädikoren, Profilieren von posterioren Wahrscheinlichkeiten). Das Programm führt schrittweise Analysen vorwärts/rückwärts oder für benutzerspezifizierte Blöcke von Variablen durch. Zusätzlich zu den zahlreichen Grafiken und Kenngrößen zur Beschreibung der Diskriminanzfunktionen stellt das Programm eine breite Auswahl an Optionen für die Klassifikation alter bzw. neuer Fälle für die Bewertung des Modells bereit. Die Ausgabe umfasst Wilks’ Lambdas, partielle Lambdas, F-für-Aufnahme (oder für Ausschluss), die p-Niveaus, die Toleranzwerte und R-Quadrat. Das Programm führt eine vollständige kanonische Analyse durch und gibt die Eigenwerte, die kumulierten Eigenwerte für alle Roots und deren p-Niveaus, die Koeffizienten der standardisierten und nichtstandardisierten Diskriminanzfunktionen, die Matrix der Strukturkoeffizienten (Faktorladungen), die Mittelwerte für die Diskriminanzfunktionen und die Werte der Diskriminanzfunktionen (Scores) für jeden Fall aus, die der Datendatei automatisch angefügt werden können. Die integrierten Grafiken beinhalten Histogramme der Scores innerhalb jeder Gruppe und für alle Gruppen gemeinsam, spezielle Scatterplots für Paare kanonischer Variablen, in denen die Gruppenzugehörigkeit der einzelnen Fälle sichtbar ist, eine umfassende Auswahl von Grafiken in Kategorien, die es dem Benutzer ermöglichen, die Verteilungen und die Beziehungen zwischen den abhängigen Variablen über die Gruppen zu untersuchen. Dazu zählen Box-Whisker-Plots, Histogramme, Scatterplots, Verteilungsplots und viele weitere. Das Modul Diskriminanzanalyse berechnet außerdem die Klassifikationsfunktionen für jede Gruppe. Die Klassifikation der Fälle kann in Abhängigkeit von den Werten der Mahalanobis-Distanzen, den Posteriori-Wahrscheinlichkeiten oder den tatsächlichen Klassifikationen vorgenommen werden. Die Scores für die einzelnen Fälle können anhand von Iconplots und weiteren "mehrdimensionalen" Grafiken veranschaulicht werden, die direkt in die Tabelle der Ergebnisse integriert sind. Alle diese Werte können der aktuellen Datendatei für weitere Analysen automatisch angefügt werden. Auch die Klassifikationsmatrix mit der jeweiligen Anzahl und dem prozentualen Anteil korrekt klassifizierter Fälle kann angefordert werden. Der Benutzer verfügt über verschiedene Optionen zur Spezifikation der a-priori-Wahrscheinlichkeiten für die Gruppenzugehörigkeit. Er kann weiter Auswahlbedingungen angeben, um ausgewählte Fälle von der Klassifikation auszuschließen bzw. diese Fälle in die Klassifikation aufzunehmen.
- Allgemeine Diskriminanzanalytische Modelle (ADM)
Das Modul STATISTICA Allgemeine Diskriminanzanalytische Modelle (ADM) ist eine Anwendung und Erweiterung des allgemeinen linearen Modells auf Klassifikationsprobleme. Ähnlich wie das Modul Diskriminanzanalyse, dient ADM zur standardmäßigen und schrittweisen Diskriminanzanalyse. ADM implementiert das diskriminanzanalytische Problem als Spezialfall des allgemeinen linearen Modells und bietet darum äußerst brauchbare Analyseverfahren, die innovativ, effizient und sehr mächtig sind. Wie bei der traditionellen Diskriminanzanalyse, erlaubt ADM die Spezifikation einer kategorialen abhängigen Variablen. Für die Analyse wird die Gruppenzugehörigkeit (in Hinblick auf die abhängige Variable) dann in Form von Indikatorvariablen kodiert, so dass alle Verfahren der ARM anwendbar sind. In den Ergebnisdialogen von ADM ist eine breite Auswahl von Residualstatistiken von ARM und ALM ebenfalls verfügbar. ADM bietet mächtige und effiziente Werkzeuge für Data-Mining und angewandte Forschungen an. ADM berechnet alle Standardergebnisse für Diskriminanzanalysen, einschließlich Koeffizienten der Diskriminanzfunktion, Resultaten der kanonischen Analyse (standardisierte und rohe Koeffizienten, Step-Down-Tests für kanonische Roots, usw.), Klassifikationsstatistiken (einschließlich Mahalanobis-Distanzen, posteriorer Wahrscheinlichkeiten, aktueller Klassifikation von Fällen in der Analyse- und Validierungsstichprobe, Fehlklassifikationsmatrix, usw.).
|








|
|
StatSoft hat auf der Basis der Technologie seiner bewährten Statistiksysteme ein neues Werkzeug zur effizienten Planung und Analyse von Forschungsstudien entwickelt: STATISTICA Power Analysis ist ein umfassendes Softwaretool, das den Anwender bei der Planung von Stichprobengrößen für Forschungsvorhaben unterstützt. Es bietet darüber hinaus eine Vielzahl von Hilfsmitteln, um alle Aspekte der Macht (Power) von statistischen Testverfahren und der Berechnung von Stichprobengrößen abzudecken.
STATISTICA Power Analysis deckt folgende Fragestellungen ab:
- Berechnung von Stichprobengrößen: STATISTICA Power Analysis berechnet Stichprobengrößen als Funktion des sogenannten Fehlers erster Art und Effektstärken in einer Vielzahl statistischer Tests (z.B. Ein- und Zweistichproben-Tests, Kontraste, Varianzanalysen, Chi-Quadrat, F-Tests oder Rang-Tests).
- Schätzung von Vertrauensintervallen: Neuerdings wird in der Statistik der Schätzung von Vertrauensbereichen starke Beachtung geschenkt, und zwar sowohl in der Planung als auch in der Auswertung von Ergebnissen. Das Programm kann für viele wichtige statistische Größen (z.B. standardisierte Effektstärke in der Varianzanalyse, Korrelationskoeffizienten oder Unterschiede zwischen Stichprobenanteilen) solche Vertrauensbereiche berechnen. Diese geschätzten Werte können ihrerseits wieder für die Berechnung von Stichprobengrößen in Folgestudien benutzt werden.
- Berechnung von StatistischenVerteilungen: Neben den bereits in STATISTICA verfügbaren Verteilungen bietet STATISTICA Power Analysis spezielle Optionen für die Güte-Berechnungen (nicht-zentrales t, F und Chi-Quadrat, Binomial, exakte Verteilung von Korrelationskoeffizienten und mehr).
Durch den Einsatz von STATISTICA Power Analysis kann man stets sicherstellen, daß die Resourcen durch den Einsatz optimaler Stichprobengrößen effizient genutzt werden. Man vermeidet, daß die Forschungsergebnisse aufgrund zu geringer Zahlen unpräzise werden, verschwendet auf der anderen Seite aber auch keine Mittel mit zu großen Untersuchungsgruppen. Die Berechnung von Güte- und Vertrauensbereichen stellt darüber hinaus eine weitere Bereicherung der Forschungsergebnisse dar.
|
 |
| |
|
| |
|
| |
|
Folgende Modulgruppen sind in Industrie enthalten
|
|
|
|
STATISTICA Versuchsplanung bietet eine Vielzahl von Verfahren zum Aufstellen von industriellen Versuchsplänen und zur Auswertung systematischer Versuchsreihen: faktorielle Zweistufenpläne (2k-p-Pläne mit Blockanlage), Siebpläne für über 100 Faktoren (einschließlich Plackett-Burman-Plänen), Suchalgorithmen für Zweistufenpläne mit maximaler Unvermengtheit der Interaktionseffekte, faktorielle Dreistufenpläne (3k-p-Pläne mit Blockanlage, Box-Behnken-Pläne), kombinierte Pläne für 2- und 3-stufige Faktoren, zentral zusammengesetzte Pläne (Wirkungsflächenpläne), Versuchspläne für Lateinische Quadrate, robuste Versuchspläne (orthogonale Felder nach Taguchi), Versuchspläne für Mischungen und Simplex-Flächen (wahlweise mit Restriktionen), Eckpunkte und Zentroide für Simplex-Flächen und Mischungen, sowie D- und A-optimale Versuchspläne für faktorielle Pläne, Flächen und Mischungen. Die implementierten Verfahren zur Plangenerierung und Auswertung darauf bezogener Versuche werden in den folgenden Abschnitten beschrieben:
- Versuchsauswertung: Allgemeines
Bei der Analyse von faktoriellen Versuchsplänen, Wirkungsflächenplänen und Versuchsplänen für Mischungen können verschiedene Modelle an die Versuchsdaten angepasst werden. Dabei lassen sich auch unbalancierte und unvollständige Pläne behandeln. STATISTICA berechnet die verallgemeinerte Inverse der Matrix X'X (X bezeichnet die Versuchsplanmatrix), um die schätzbaren Effekte und die aus Vermengung entstandenen Aliasse anderer Effekte zu bestimmen. Eine tabellarische Übersicht der Aliasse und der Parameterschätzungen für alle nicht-redundanten Effekte wird erstellt. Sie können ausgewählte Effekte in das Modell auf- bzw. aus dem Modell herausnehmen und die dadurch hervorgerufene Veränderung der Anpassung beobachten. Alle Analysen lassen sich mit kodierten oder unkodierten Faktoren durchführen. Eine große Zahl von Ausgabeoptionen zur Anzeige von Parameterschätzungen und ANOVA-Ergebnissen sind verfügbar. Analytische und grafische Optionen stehen für die aus den Faktoreinstellungen prognostizierbaren Versuchsgrößen (Mittelwerte, Anpassungsflächen) zur Verfügung und werden nachfolgend im Zusammenhang mit den jeweiligen Designs beschrieben.
- Residualanalysen und Transformationen
Zur Analyse der Residuen eines gegebenen Modells berechnet STATISTICA Prognosewerte und Residuen mit Standardfehler, benutzerdefinierte Prognoseintervalle, Konfidenzintervalle für prognostizierte Werte und Residuen, Residuen für gelöschte Beobachtungen, studentisierte Residuen, Leverage-Werte, Mahalanobis- und Cook-Distanzen und DFFIT- und standardisierte DFFIT-Werte. Alle Residualstatistiken lassen sich zum Zwecke weiterer Analysen speichern (z.B. Berechnung serieller Korrelationen mit dem Modul Zeitreihen). Die Residualstatistiken können in der Reihenfolge der Beobachtungen (Fallzahlen) oder nach Größe sortiert ausgegeben werden, was die Ausreißerdiagnostik erleichtert. Zur Modellanpassung und Ausreißerdiagnostik dienen Histogramme der Residuen und Prognosewerte, Scatterplots der Residuen gegen die Prognosewerte oder Fallzahlen. In allen Grafiken lassen sich Ausreißer durch Fallnummern oder Labels identifizieren. Ein wichtiges Werkzeug zur Bewertung der Modellgüte sind Box-Cox-Transformationen für abhängige Messgrößen (Response-Variablen), deren Lambda-Werte mit Maximum-Likelihood geschätzt werden. Ein Plot der Quadratsummen von Residuen gegen Lambda mit zugehörigen Konfidenzgrenzen ist abrufbar.
- Optimieren von Response-Variablen mit Wirkungs-/Wunschprofilen
Einzigartige Optionen in STATISTICA ermöglichen die interaktive Optimierung einer oder mehrerer Response-Variablen. Die Faktoreinstellungen für Minimum, Maximum oder Sattelpunkt der Wirkungsflächen zweiter Ordnung werden berechnet. Um die Krümmung und Orientierung von quadratischen Wirkungsflächen zu bestimmen, werden deren kritische Werte gemeinsam mit den Eigenwerten und Eigenvektoren berechnet. Zu beachten ist, dass die Optionen der Wunschfunktionen für Mischungspläne nicht auf der einfachen Reparametrisierung des Mischungsmodells zu einem Wirkungsflächenmodell ohne Nebenbedingungen beruhen (was zu Fehlresultaten wie optimalen Faktoreinstellungen für ungültige Mischungen führen kann), sondern auf der Grundlage des aktuellen (restringiert angepassten) Mischungsmodells. Bei der Suche nach optimalen Faktoreinstellungen mit einer Wunschfunktion für eine oder mehrere Response-Variablen wird also sichergestellt, dass nur restringierte (Mischungs-) Versuchsregionen untersucht werden und die resultierenden Faktoreinstellungen gültige Mischungen darstellen. STATISTICA stellt viele grafische Optionen für die Visualisierung der Prognosewerte von Response-Variablen als Funktion jedes einzelnen Faktors in der Analyse zur Verfügung. Die restlichen Faktoren werden jeweils konstant gehalten. Die erwünschten Wirkungen auf eine oder mehrere Response-Variablen lässt sich in einer Wunschfunktion anzeigen, die auf den zugehörigen Prognosewerten basiert. Sie können die Profile der Wunschfunktion und prognostizierten Response-Werten über eine benutzerdefinierte Stufenzahl für jeden Faktor plotten.
Darüber hinaus lassen sich die Wunschfunktion in 3D-Flächenplots oder Konturenplots darstellen and Matrizen solcher Plots für alle Faktoren in der Analyse abfordern (siehe die linke Abbildung). Alle Einstellungen wie Faktorgitter oder Wunschfunktion können schnell für interaktive Analysen verändert werden (Sie können beispielsweise bestimmte Response-Variablen aus der Analyse ausschließen, um die Auswirkung auf die Gesamt-Wunschfunktion zu beobachten). Die Spezifikationen für komplexe Wunschfunktionen lassen sich speichern und für spätere Analysen mit gleichen Response-Variablen wieder verwenden. Mit Hilfe eines implementierten Rechenverfahrens oder einer Gittersuche in der Grafik wird das Optimum der Wunschfunktion bestimmt. Zu beachten ist, dass Optionen für Wunschprofile auch in STATISTICA Allgemeine Lineare Modelle (ALM), Allgemeine Regressionsmodelle (ARM) und Allgemeine Dsikriminanzanalytische Modelle (ADM) (für kategoriale Response-Variablen) angeboten werden.
- Zweistufige fraktionierte faktorielle Standardpläne mit Blockanlage (2k-p-Pläne)
Das Modul Versuchsplanung enthält einen Katalog aller zweistufigen Standardpläne minimaler Aberration (vgl. Box und Draper, 1987; Box, Hunter und Hunter, 1978; Montgomery, 1991). Der Benutzer kann die Versuchspläne generieren, die Reihenfolge der Runs randomisieren und dem Plan leere Spalten zur Aufnahme von Messwerten hinzufügen. Darüber hinaus lassen sich die Faktoreinstellungen spezifizieren und kodieren (-1, +1), Replikationen anfordern, Nullpunkte hinzufügen oder eine Faltung (fold-over) des Originalplanes vornehmen. STATISTICA zeigt die Generatoren für den fraktionierten Plan, die Blockgeneratoren, sowie die Aliasmatrix der Haupteffekte und Interaktionen an. Das Modul Versuchsplanung führt automatisch eine vollständige ANOVA für die Versuchsdaten durch. Der Benutzer steuert die Aufnahme von Effekten und Interaktionen in das Modell. Er kann sich die Korrelationen zwischen den Spalten der Versuchsplanmatrix (X), die Inverse der Matrix X'X (d.h. die Kovarianz- und Korrelationsmatrix der Parameterschätzungen) anzeigen lassen. Das Programm berechnet Parameterschätzwerte des ANOVA-Modells, Koeffizienten für kodierte oder unkodierte Faktorstufen, sowie Prognosewerte für benutzerspezifizierte Faktorstufen. Für die genannten Schätzwerte sind jeweils auch Standardfehler und Konfidenzintervalle verfügbar.
Wenn der Versuchsplan zumindest partiell wiederholt wurde, berechnet STATISTICA eine ANOVA-Tabelle mit dem geschätzten reinen Fehler und führt einen Test auf Fehlanpassung (lack-of-fit) durch. Enthält der Versuchsplan Nullpunkte, ist ein Krümmungstest zur Prüfung nichtlinearer Effekte möglich. Der Benutzer kann die Tabelle der Mittelwerte und Randmittelwerte mit den jeweiligen Konfidenzintervallen ausgeben lassen. Zahlreiche Optionen stehen für die grafische Darstellung der Ergebnisse zur Verfügung: Paretodiagramme der Effekte, Normalverteilungsplots der Effekte, Quadrat- und Würfel-Plots, Mittelwerte- und Interaktionsplots mit Konfidenzintervallen der Randmittelwerte, sowie Wirkungsflächen- und Wirkungskonturen-Plots. Daneben lassen sich die in den vorangegangenen Abschnitten beschriebenen Funktionen für Residualanalysen und Optimierung von Response-Variablen aufrufen.
- Suchverfahren für fraktionierte 2-stufige Pläne minimaler Vermengung
Das Modul Versuchsplanung ermöglicht neben der Aufstellung von 2k-p-Standardplänen die Suche nach fraktionierten faktoriellen Plänen mit minimaler Aberration bei minimaler Vermengung. Diese Pläne können Blöcke, mehr als 100 Faktoren und ggf. mehr als 2000 Runs ausweisen. Sie ermöglichen die Bewertung einer größeren Anzahl von (ausgewählten) Interaktionen als die gewöhnlichen Box-Hunter-Pläne. Bei vorgegebener Auflösung lassen sich entweder alle (nicht-isomorphen) Sets von Generatoren auffinden oder Sets von Interaktionen spezifizieren, die unvermengt bleiben sollen. Zusätzlich zu dem Kriterium "minimaler Aberration" kann auch das Kriterium "maximaler Unvermengtheit" gewählt werden, womit bei vorgegebener Auflösung ein Plan mit der maximal möglichen Anzahl von unvermengten Effekten erzeugt wird. Diese Pläne lassen sich wie 2k-p-Versuchspläne analysieren und durch Hinzufügen von Replikationen, Nullpunkten und Faltung erweitern.
- Siebpläne (Plackett-Burman)
STATISTICA Versuchsplanung ermöglicht das Aufstellen und Auswerten von Siebplänen für eine große Anzahl von Faktoren (Screening). STATISTICA generiert Plackett-Burman-Pläne (Hadamard-Matrix) und gesättigte fraktionierte faktorielle Pläne mit bis zu 127 Faktoren. Wie bei den 2k-p-Plänen können Replikationen angefordert, Nullpunkte hinzugefügt sowie der Versuchsplan gedruckt oder gespeichert werden. Für die Auswertung von Siebplänen stehen die gleichen Optionen wie für 2k-p-Pläne zur Verfügung.
- Dreistufige fraktionierte faktorielle Pläne (3k-p-Pläne) mit Blockanlage
Eine weitere Gruppe von implementierten Versuchsplänen sind 3k-p-Standardpläne mit Blockanlage und Box-Behnken-Pläne. Auch hier kann der Benutzer den Versuchsplan randomisieren, Replikationen anfordern, einzelne Runs hinzufügen, den Plan und Block-Generatoren anzeigen lassen und die Aufnahme von Effekten in das Modell steuern. Bei der Analyse von 3k-p-Plänen werden die Haupteffekte nach linearen und quadratischen Effekten gegliedert, die Interaktionen je nach den beteiligten Komponenten in linear-linear, linear-quadratisch, quadratisch-linear und quadratisch-quadratisch. Die ANOVA-Tabelle liefert separate Tests für lineare und quadratische Komponenten, sowie für zusammengefasste Effekte. Darüber hinaus stehen für die Auswertung von 3k-p-Plänen die gleichen Optionen wie für 2k-p-Pläne zur Verfügung. Das Modul unterstützt auch kombinierte Versuchspläne mit zwei- und dreistufigen Faktoren.
- Zentral zusammengesetzte Pläne (Wirkungsflächenpläne)
Der Benutzer kann aus einem Katalog von Standardplänen wählen, einschließlich kleiner zentral zusammengesetzter Pläne nach Plackett-Burman. Diese Pläne lassen sich durch Hinzufügung von sog. „Sternpunkten“ unterhalb der niedrigsten und oberhalb der höchsten Faktoreinstellung aus dreistufigen Plänen erzeugen (central composite designs). Die Sternpunkte sind einander gegenüber zentriert oder auf Drehbarkeit und Orthogonalität der Faktorstufen bezogen. Die Optionen zur Auswertung entsprechen denen, die für 3k-p und 2k-p-Pläne weiter oben beschrieben sind.
- Lateinische Quadrate
Der Benutzer kann Versuchspläne aus Lateinischen Quadraten mit bis zu neun Stufen erzeugen und auswerten. Daneben bietet das Modul auch Griechisch-Lateinische Quadrate und Hyper-Griechisch-Lateinische Quadrate an. Wenn alternative Lateinische Quadrate verfügbar sind, kann die Auswahl vom Benutzer gesteuert oder dem Programm überlassen werden. Auch diese Versuchspläne lassen sich randomisieren, um Eingabespalten erweitern und speichern. Zusätzlich zur ANOVA-Tabelle berechnet STATISTICA die Randmittelwerte für alle Faktoreinstellungen und stellt diese grafisch dar.
- Versuchspläne für robuste Prozesse/Produkte (nach Taguchi)
Das Modul Versuchsplanung generiert nach Taguchi-Methoden orthogonale Felder für bis zu 31 Faktoren und erlaubt eine Auswertung von Versuchen mit bis zu 65 Faktoren. Dabei lassen sich neben den Haupteffekten auch Aliasse der Zweifach-Interaktionen untersuchen. Die in robusten Plänen gebräuchlichen Signal-Rausch-Verhältnisse (Signal-to-Noise ratios, S/N ratios) werden für folgende Problemstellungen berechnet: (1) Minimalwert = Bestwert (Smaller-the-better), (2) Nominalwert = Bestwert (Nominal-the-best), (3) Maximalwert = Bestwert (Larger-the-better), (4) Signiertes Ziel (Signed target), (5) Ausschussanteile (Fraction defective), sowie (6) Ausschussanzahlen pro Intervall als Akkumulationsanalyse (Number defective per interval, accumulation analysis). Darüber hinaus können auch nicht transformierte Daten analysiert werden. Dadurch ist es möglich, beliebige, mit Hilfe von Datenblattformeln oder STATISTICA Visual Basic definierte Signal-Rausch-Verhältnisse zu erstellen und diese im Modul Versuchsplanung auszuwerten. Mit umfassenden deskriptiven Statistiken kann sich der Benutzer die berechneten Signal-Rausch-Verhältnisse ausgeben lassen. Die ANOVA-Tabelle ermöglicht dem Benutzer, Effekte in den Fehlerterm interaktiv aufzunehmen oder zu entfernen. Der Eta-Wert, welcher das Signal-Rausch-Verhältnis repräsentiert, wird für optimale Einstellungen der Faktorstufen prognostiziert. Auch hier kann der Benutzer Effekte aufnehmen oder ausschließen und Stufen für ausgewählte Faktoren spezifizieren. Die Mittelwerte von Eta sind für die Faktorstufen übersichtlich in eine Grafik umgesetzt. Bei der Akkumulationsanalyse kategorialer Daten lassen sich sowohl Balken- als auch Linienplots erstellen. In diesen Plots werden die kumulierten Anteile über die Kategorien innerhalb jeder Stufe der ausgewählten Faktoren dargestellt. Zu beachten ist, dass die unterschiedlichen Typen von Wunschfunktionen für einzelne oder mehrere Variablen auch im Zusammenhang mit 2k-p-Plänen, 3k-p-Plänen und zentral zusammengesetzten Plänen (oder in ALM, ARM, ADM) optimiert werden können.
- Simplexpläne für Mischungen
Diese Verfahren beinhalten Optionen für das Aufstellen von Simplex-Gitter- und Simplex-Zentroid-Plänen für Mischungen. Die Versuchspläne können durch zusätzliche innere Punkte und einen Zentroid erweitert werden. Der Benutzer kann "untere" (größer-gleich) Nebenbedingungen für jeden Faktor angeben, worauf das Programm automatisch den entsprechenden Versuchsplan konstruiert, der auf dem durch die Nebenbedingungen definierten Sub-Simplex gegeben ist. Für die Behandlung unterer und oberer Nebenbedingungen stehen allgemeine Verfahren zur Konstruktion von Versuchsplänen in restringierten Versuchsgebieten zur Verfügung (siehe unten). Das Programm berechnet Koeffizienten für Pseudokomponenten und Komponenten in ihren originalen Einstellungen, sowie die zugehörigen Standardfehler, Konfidenzintervalle und Signifikanztests. Als Standard sind lineare, quadratische, spezielle kubische und vollständige kubische Modelle verfügbar. (Hinweis: Das Modul STATISTICA Allgemeine Lineare Modelle (ALM) bietet ebenfalls Verfahren zur Analyse von Mischungsversuchen an.) Spezielle Grafiken fassen die Ergebnisse von Mischungsversuchen zusammen. Dazu zählen Plots der Wirkungsspuren für benutzerdefinierte Referenzmischungen sowie ternäre Flächen- und Konturenplots. Enthält der Versuch mehr als drei Komponenten, können die Flächen- und Konturenplots für benutzerdefinierte Werte der nicht im Plot dargestellten Komponenten erstellt werden. Darüber hinaus bietet STATISTICA auch für Mischpläne das breite Spektrum von Auswertungsoptionen der faktoriellen Versuchspläne an. Die Optionen für Wirkungs-/Wunschprofile beruhen bei diesen Plänen nicht auf einer verzerrenden Umparametrisierung des Mischungsmodells in ein nichtrestringiertes Wirkungsflächenmodell sondern direkt auf dem restringierten Mischungsmodell. Dadurch beschränkt sich die Suche nach den optimalen Faktoreinstellungen bei gegebener Wunschfunktion für Response-Variablen auf das restringierte Mischungsgebiet und resultierende Faktoreinstellungen addieren sich stets zur Mischungssumme.
- Mischungspläne für restringierte Simplex-Flächen
STATISTICA Versuchsplanung enthält Verfahren zur Konstruktion von Eck- und Zentroid-Punkten für Simplex-Flächen, die linearen Nebenbedingungen unterworfen sind. Der Benutzer kann obere und untere Grenzen für Mischungskomponenten angeben und lineare Nebenbedingungen der Form x1 + .. + xi + x0 >= 0 für diese Faktoren spezifizieren. Das Programm berechnet dann für das restringierte Versuchsgebiet die Lage der Eckpunkte sowie optional die Lage der Zentroid-Punkte. Die Nebenbedingungen werden sequentiell verarbeitet und auf Redundanzen geprüft. Zusätzlich zu den allgemein verfügbaren Ausgabeoptionen für Versuchspläne lassen sich Informationen über das restringierte Versuchsgebiet abrufen. Der Benutzer kann die Eck- und Zentroid-Punkte in 3D- und ternären Scatterplots (für Mischungen) betrachten. Basierend auf der Kenntnis der Eck- und Zentroid-Punkte können so die Charakteristika des Versuchsplanes bewertet werden. Diese Punkte können anschließend an die Verfahren zur Bestimmung optimaler Pläne (siehe unten) übergeben werden, um Pläne mit einer minimalen Anzahl von Runs zu konstruieren.
- D- und A-optimale Pläne
Das Programm bietet leistungsfähige Algorithmen zur Optimierung von Versuchsplänen für Wirkungsflächen oder Mischungen. Der Benutzer kann Modellformen (z.B. linear, quadratisch) spezifizieren und zwischen den Methoden D- oder A-Optimalität wählen. Eine Liste von Startpunkten (candidate points) für den Versuchsplan lässt sich eingeben oder aus einer STATISTICA-Datendatei einlesen, wenn faktorielle Pläne oder Mischpläne zuvor gespeichert wurden. Die Punkte für den endgültigen Plan lassen sich in dieser Liste markieren. Damit kann der Benutzer vorhandene Versuchspläne erweitern oder sogar "reparieren". Das Modul enthält alle gebräuchlichen Suchalgorithmen zur Konstruktion D- und A-optimaler Pläne: die sequentielle Methode (Dykstra), die Methode des einfachen Austauschs (Wynn-Mitchell), Mitchells DETMAX-Algorithmus (Austausch mit Exkursionen), die ursprüngliche Fedorov-Methode des simultanen Austauschs und eine modifizierte Fedorov-Methode des simultanen Austauschs. Für den endgültigen Plan berechnet das Programm neben den üblichen Matrizen die Determinante der Matrix X'X sowie die Maße für D-, A- und G-Effizienz. Die Punkte des endgültigen Versuchsplanes sind in 3D- und ternären Scatterplots (für Mischungen) darstellbar.
- Alternative Verfahren zur Analyse von experimentellen Daten
STATISTICA bietet eine große Anzahl von Berechnungsverfahren zur Analyse von Versuchsdaten und zur Anpassung von ANOVA/ANCOVA-ähnlichen Designs für stetige oder kategoriale Ausgabevariablen. Insbesondere enthält STATISTICA vollständige Implementierungen von:
- Allgemeine Lineare Modelle (ALM) und Allgemeine Regressionsmodelle (ARM) (in STATISTICA Höhere Modelle) mit differenzierten Verfahren zur Modellentwicklung (schrittweise und Beste-Subset-Auswahl von Prädiktoren),
- Verallgemeinerte Lineare Modelle (VLM) (in STATISTICA Höhere Modelle), mit schrittweise und Beste-Subset-Auswahl von Prädiktoren in ANOVA/ANCOVA-ähnlichen Designs für verschiedene Alternativen zu linearen Kleinste-Quadrate-Modellen wie Logit-, multinomiale Logit- und Probit-Modellen,
- Allgemeine Diskriminanzanalytische Modelle (ADM) (in STATISTICA Explorative Verfahren), die den Einsatz von ANOVA/ANCOVA-ähnlichen Versuchsplänen zur Klassifikation sowie den Gebrauch der schrittweisen und Beste-Subset-Auswahl von Prädiktoren ermöglicht. ADM enthält außerdem Wunschprofile und Optimierungsverfahren, die sich zur Bestimmung von Faktorkombinationen, -stufen und/oder -werten mit maximaler posteriorer Klassifikationswahrscheinlichkeit für eine oder mehrere Kategorien der abhängigen (Ausgabe-) Variablen eignen,
- Klassifikations- und Regressionsbäume (in STATISTICA Explorative Verfahren) und General CHAID models (in STATISTICA Data Miner), die eine Bestimmung der Effizienz von ANOVA/ANCOVA-ähnlichen Versuchsplänen zur Entwicklung nichtlinearer hierarchischer Klassifikations- oder Regressionsbäume ermöglichen.
STATISTICA lässt sich daher auf kreative und innovative Weise in der Forschung zur Qualitätssicherung einsetzen, wenn die interessierende abhängige Variable kategorialer Natur ist, oder wenn die Wirkungen der Prädiktorvariablen (Effekte) nichtlinear Natur sind.
|














|
| |
|
|
STATISTICA Prozessanalyse besteht aus Modulen mit Verfahren der Prozessfähigkeitsanalyse, der Analyse der Wiederhol- und Vergleichpräzision von Messungen (R&R), der Weibull-Analyse und der Erzeugung von Stichprobenplänen, welche nachfolgend beschrieben werden.
- Prozessfähigkeitsanalyse
Das Modul Prozessanalyse enthält eine breite Auswahl von Optionen zur Berechnung von Prozessfähigkeitsindizes (Cp, Cr, Cpk, Cpl, Cpu, Cpm), Prozessleistungsindizes (Pp, Pr, Ppk, Ppl, Ppu) und zugehörigen Toleranzgrenzen. Ergebnisse werden als Histogramm mit Prozessbereich, Spezifikationsgrenzen und Normalverteilungsdichte veranschaulicht. Die wichtigsten dieser Indizes sind nicht nur für normalverteilte Messwerte verfügbar, sondern auch für stetige Verteilungen wie Beta, Exponential, Extremwert (Typ I, Gumbel), Gamma, Lognormal, Rayleigh und Weibull, sowie für allgemeine Nicht-Normalverteilungen (mittels Johnson- und Pearson-Kurven). STATISTICA berechnet Maximum-Likelihood-Schätzungen für die Parameter dieser Verteilungen und stellt zahlreiche Optionen zur Bewertung ihrer Anpassungsgüte an die Daten bereit. Dazu zählen Tabellen mit beobachteten und erwarteten Häufigkeiten, die Kolmogorov-Smirnovsche d-Statistik, Histogramme, Probability-Probability (P-P)-Plots und Quantil-Quantil (Q-Q)-Plots. Außerdem gibt es eine Option zur automatischen Anpassung aller Verteilungen an die Daten und der Auswahl des bestangepassten Verteilungstyps.
- Wiederhol- und Vergleichpräzision von Messungen (R&R)
Mit STATISTICA lassen sich Untersuchungen zur Wiederholbarkeit und Vergleichbarkeit (R & R für Repeatability and Reproducibility) von Messdaten aus ein- bis mehrfachen Versuchen (trials) sowohl analysieren als auch planen. Das Modul berechnet nach Bedienern und Teilen gegliedert deskriptive Statistiken und Spannweiten- oder Sigma-Karten. Außerdem werden Box-Whisker-Plots und ein zusammenfassender R&R-Plot erstellt. Die Variabilität zwischen Versuchen (Wiederholbarkeit), Prüfern (Vergleichbarkeit), Teilen oder deren Interaktion werden als Varianzkomponenten geschätzt. Wenn diese Komponenten nicht aus Spannweiten sondern aus den mittleren Quadraten der ANOVA abgeleitet werden, erfolgt auch eine Berechnung der zugehörigen Konfidenzintervalle. Daneben sind prozentuale Toleranzwerte, die Prozessvariation und die Gesamtvariation verfügbar. Eine umfassende Auswahl von Verfahren zur Schätzung der Varianzkomponenten für zufällige Effekte wird jeweils vom Modul STATISTICA Varianzkomponenten und Allgemeine Lineare Modelle in STATISTICA Höhere Modelle bereitgestellt.
- Weibull-Analyse
Die Weibull-Analyse nutzt Eigenschaften der Weibull-Verteilung zur Schätzung der Zuverlässigkeit bzw. der Ausfallszeit von Industrieprodukten. Mit STATISTICA lassen sich Weibull-Verteilungsplots für vollständige, einfach-zensierte und mehrfach-zensierte Daten erstellen. Die zugehörigen Parameter und ihre Konfidenzintervalle werden aus Ausfallraten-Plots der Ausfallreihenfolge (failure orders) abgeleitet. Als Schätzverfahren für vollständige und zensierte Daten dienen Maximum-Likelihood und gewichtete Faktoren. Daneben kommen modifizierte Momentschätzer zum Einsatz, die unverzerrt im Hinblick auf Mittelwert und Varianz sind. Konfidenzintervalle werden sowohl für Form-, Skalen- und Lageparameter als auch für Perzentile berechnet. Das Programm ermöglicht grafische Diagnosen der Anpassungsgüte und statistische Anpassungstests nach Hollander-Proschan, Mann-Scheuer-Fertig oder Anderson-Darling. Zu beachten ist, dass das Modul Allgemeine Lineare Modelle in STATISTICA Höhere Modelle Optionen zur Anpassung von verallgemeinerten linearen Modellen aus der Familie der Exponentialverteilungen für normale und nicht-normale Daten bereitstellt.
- Stichprobenpläne
Für den Test von Hypothesen, die sich auf kontinuierliche Messgrößen oder zählbare Attribute (Mängel, Ausschuss) beziehen, lassen sich mit STATISTICA wahlweise feste oder sequentielle Stichprobenpläne erzeugen, und zwar für normalverteilte Merkmale, Binomial-Anteile oder Poisson-Häufigkeiten. Für feste Stichprobenpläne wird der zur Bestätigung oder Widerlegung einer vorgegebenen Hypothese H0 erforderliche Stichprobenumfang ermittelt und die zugehörige Operationscharakteristik (OC-Kurven) dargestellt. Sequentielle Pläne werden mit erwarteten Run-Längen (unter H0/H1) generiert. Zu beachten ist, dass STATISTICA Power Analysis ebenfalls Optionen zur Ermittlung des erforderlichen Stichprobenumfangs und Schätzung der Teststärke (Macht) für viele Forschungsdesigns (z.B. ANOVA) und andere Datentypen (z.B. für binäre Zähldaten, zensierte Ausfallzeiten) bereitstellt.
|




|
| |
|
|
STATISTICA Regelkarten bietet eine breite Auswahl an Verfahren der Qualitätssicherung mit präsentationsreifen Regelkarten. Sie eignen sich besonders für Qualitätssicherungssysteme unterschiedlichen Komplexitätsgrads auf Werkerebene (siehe auch STATISTICA unternehmensweites SPC-System SEWSS) ebenso wie für spezielle Analysen und Six-Sigma-Vorhaben zur Qualitätssicherung.
Zur Beschleunigung von routinemäßig durchzuführenden Arbeiten stehen Optionen zur Automatisierung sowie Shortcuts der Benutzeroberfläche zur Verfügung. Layout-Optionen für Grafiken und weitere Spezifikationen lassen sich als System-Voreinstellungen und wiederverwendbare Vorlagen speichern. STATISTICA Regelkarten verfügt über eine leistungsfähige Funktionalität, mit deren Hilfe neue Prozeduren entwickelt und dem System hinzugefügt werden können und Optionen zur Integration von Qualitätssicherungsanalysen in bestehende Datenaufnahme- und Monitoring-Systeme.
Weitergehende Informationen finden Sie zu folgenden Punkten:
- Standardkarten
STATISTICA generiert folgende Standardkarten zur Qualitätssicherung: X-quer-Karten, R-Karten, S-Karten, Np- und P-Karten (Binomial-Statistik), C- und U-Karten (Poisson-Statistik), CuSum-Karten (cumulative sum) für Ausreißerdiagnostik, Moving-Range-Karten, Runs-Karten (für Einzelbeobachtungen), MA-Karten (moving average) und EWMA-Karten (exponentially-weighted moving average). Außerdem sind Paretodiagramme zur Analyse von Qualitätseinbußen verfügbar. Die meisten Variablen-Regelkarten (z.B. R-Karten) lassen sich wahlweise für Einzelbeobachtungen oder Stichproben generieren und mit Six-Sigma-Grafiken kombinieren. Sollwerte und Eingriffsgrenzen sind jeweils benutzerdefiniert oder werden aus den Daten geschätzt (z.B. Mittelwerte, Spannweiten, Anteile). Eingriffsgrenzen beziehen sich auf ein Mehrfaches der Standardabweichung (z.B. ±3-Sigma), auf normale oder nichtnormale (Johnson-Kurven) Perzentile (z.B. p=0,01; 0,99) oder konstante Werte. Für ungleiche Stichprobenumfänge lassen sich Regelkarten mit variablen Eingriffsgrenzen oder standardisierten Werten erstellen. Eine Qualtitätsregelkarte kann mehrere Sätze von Spezifikationen einbeziehen und vom Benutzer vollständig den eigenen Bedürfnissen entsprechend modifiziert werden.
- Interaktives, analytisches Brushing. Das Modul Qualitätsregelkarten bietet spezielle "intelligente" Brushing-Verfahren zur Behandlung von Ausreißern (oder Was-wäre-wenn-Analysen) in einzelnen oder parallel in einem Satz von Regelkarten. Der Benutzer kann nach spezifizierten Kriterien (z.B. Eingriffsgrenzen oder Runs Tests) einzelne oder Gruppen von Stichproben auswählen, sie aus den Berechnungen für die Regelkarte ausschließen (aber dennoch in der Karte anzeigen) oder gänzlich aus der Karte entfernen. Die Ein- und Ausschlussbedingungen lassen sich auf mehrere Karten parallel anwenden, so dass sie gleichzeitig per Brushing untersucht werden können. So können beispielsweise in der X-quer-Karte markierte und ausgeschlossene Werte gleichzeitig aus den Histogrammen entfernt werden.
- Aktionen und Ursachen zuweisen. Der Anwender kann Ausreißern (oder jedem anderen Punkt in der Karte) Ursachen, Aktionen und/oder Kommentare zuweisen. Dies können Abkürzungen oder längere Texte sein. Stichproben außer Kontrolle können in den Karten entweder mit Hilfe der interaktiven Brushing-Funktion oder automatisch durch das Programm identifiziert und mit den Kommentaren versehen werden.
- Flexible Alarmmeldungen. Eine Vielzahl von Optionen erlauben die Festlegung von Kriterien, die „Außer-Kontrolle-Bedingungen“ definieren: Etwa die Verletzung von Runs-Tests oder die Überschreitung von Spezifikationsgrenzen. Mit den Alarmfunktionen können nun verschiedene Arten von „Antworten“ auf bestimmte Ereignisse festgelegt werden: Beispielsweise kann als „Antwort“ auf eine außer Kontrolle geratene Stichprobe der Bediener zunächst automatisch aufgefordert werden, einen Grund dafür einzugeben; anschließend wird ein STATISTICA Visual Basic-Programm ausgeführt, das verschiedene Statistiken berechnet und dann ein externes Programm (DLL) angestoßen, um den verantwortlichen Ingenieur per E-Mail zu benachrichtigen. Diese Alarm-Optionen können in einer Konfigurationsdatei gespeichert und für spätere Regelkarten oder als Voreinstellung verwendet werden.
- Supervisor- und Anwendermodus, Passwortschutz. Die Editierfunktionen und Spezifikationen aller Regelkarten sowie die Grunddaten können durch ein Passwort geschützt werden. Dies erlaubt die Einrichtung eines Bedienermodus mit eingeschränktem Zugang zu den Karten und Daten. Die Regelkarten können durch den verantwortlichen Ingenieur erstellt und gespeichert werden, während der Bediener sie mit seinen eingeschränkten Zugriffsmöglichkeiten laden kann.
- Datenorganisation. Daten können auf verschiedene Weise organisiert sein, so dass nahezu alle Formate in QR-Anwendungen unterstützt werden. Stichproben und Teile lassen sich über eine Stichproben-Kodierung oder über eine frei gewählte Anzahl von Messungen pro Stichprobe (und Teil, siehe unten) identifizieren.
- Short-Run-Karten
Standard-Variablen-Regelkarten (X-quer, R, S, MA, EWMA) und Attribut-Regelkarten (C, U, Np, P) können auch für kurze Produktionsdurchläufe verwendet werden (Short-Run-Karten für mehrere Teile oder Maschinen). Bei Short-Run Variablen-Regelkarten lassen sich Sollwerte (Nominalwerte) für Teile (Nominal-Short-Run-Karte) vorgeben, oder Zielwerte (target) und Variabilitätswerte zur Standardisierung. Optionen zur Sortierung der Stichprobenpunkte in der jeweiligen Regelkarte und zur Darstellung in unterschiedlicher Reihenfolge sind verfügbar. Als Datendatei gespeicherte Spezifikationen (Parameter) für Teile sind auf neue Datensätze anwendbar. STATISTICA berechnet detaillierte Statistiken wahlweise für Teile oder Stichproben, deren Kodierung in der Datendatei für jede Messung spezifiziert oder nachträglich zugewiesen wird. Alle Optionen für Standardkarten (z.B. Prozessfähigkeitsindizes, Runs Rules) stehen auch für Short-Run-Karten zur Verfügung.
- Optionen und Statistiken für Regelkarten
Eine Vielzahl von zusätzlichen QR-Statistiken sind abrufbar und werden gemeinsam mit der Karte aktualisiert. Dazu gehören Prozessfähigkeits- und Prozessleistungsindizes (z.B. Cpk, Ppk, ), Histogramme der jeweiligen Qualitätskenngrößen sowie sieben verschiedene Runs-Tests. Standard-Variablen-Regelkarten lassen sich in eine Verbundgrafik einbinden, beispielsweise eine X-quer- und R-Karte mit Histogrammen für die Mittelwerte und Spannweiten. Ausreißer (Stichproben außerhalb der Eingriffsgrenzen) oder mittels Runs-Tests identifizierte auffällige Beobachtungswerte werden automatisch im Diagramm hervorgehoben. Außerdem lassen sich Warngrenzen, (exponentiell gewichtete) gleitende Mittelwerte oder Spezifikationsgrenzen hinzufügen.
- Prozessfähigkeitsindizes für nicht-normale Eingriffsgrenzen. Bei Stichproben mit schiefer Häufigkeitsverteilung werden Fehlerraten oft unter- oder überschätzt, wenn sie aus der Wahrscheinlichkeitsdichte einer Normalverteilung abgeleitet sind. STATISTICA generiert auch Regelkarten, die nicht an diese Verteilungsannahme gebunden sind. Die zugehörigen Eingriffsgrenzen basieren dann auf der Anpassung von Johnson-Kurven an die ersten vier Momente (Mittelwert, Standardabweichung, Schiefe und Exzess) der Daten. Dabei können diese Momente aus den Daten geschätzt oder vom Benutzer spezifiziert werden. Die errechneten Prozessfähigkeitsindizes beziehen sich auf angepasste Johnson- oder Pearson-Kurven. Im Modul Prozessanalyse (einem Add-On) lassen sich darüber hinaus Fähigkeitsindizes für Weibull-, Beta- oder Lognormal-Verteilungen erstellen.
- Weitere Plots und Ergebnistabellen. Für die Mehrzahl der Karten (einschließlich der R-Karte) kann der Benutzer die jeweilige Operationscharakteristik berechnen und grafisch umsetzen. Die exakten Werte der in der Karte dargestellten Linien und Punkte lassen sich in einer Ergebnistabelle einsehen. Außerdem kann STATISTICA eine Kartenvorlage produzieren, die der Ingenieur für Qualitätssicherung später per Hand ausfüllt. Die im Modul Qualitätsregelkarten erstellten Grafiken lassen sich wie alle STATISTICA-Grafiken nachträglich bearbeiten und für weitere Analysen speichern.
- STATISTICA unternehmensweite Systeme
- Echtzeit-Qualitätssicherungssysteme und externe Datenquellen. Alle Regelkarten und sonstigen Plots des Moduls STATISTICA Regelkarten können mit den Daten verknüpft und bei Vorliegen neuer Daten automatisch aktualisiert werden. Für den Datentransfer von externen Datenquellen stehen (optional) STATISTICA-Anwendungen (SEWSS und SEDAS) zur Verfügung:
- STATISTICA unternehmensweites Datenanalysesystem (SEDAS). SEDAS ist eine vollständig in ein mächtiges, zentrales Data-Warehouse integrierte Groupware-Version von STATISTICA, die eine effiziente Schnittstelle zu unternehmensweiten Datenablagen und Einrichtungen zur gemeinsamen Arbeit (ausgedehnte Groupware-Funktionalität) besitzt.
- STATISTICA unternehmensweites SPC-System (SEWSS). SEWSS ist ein integriertes Mehrbenutzer Software-Paket, das alle Funktionen für eine unternehmensweite Installation der statistischen Prozesslenkung (SPC) besitzt. SEWSS enthält eine zentrale Datenbank, bietet alle erforderlichen Werkzeuge zur Verarbeitung und Handhabung von Daten aus mehreren Kanälen und koordiniert die Arbeit mehrerer Werker, QS-Ingenieure und Verantwortlicher.
- SEWSS und SEDAS bieten sehr flexible Einrichtungen zur Integration der Verfahren von STATISTICA Qualitätsregelkarten in Ihre unternehmensweite Datenbank und zum Aufbau eines firmenweiten Systems der Qualitätsüberwachung.
|






|
| |
|
|
StatSoft hat auf der Basis der Technologie seiner bewährten Statistiksysteme ein neues Werkzeug zur effizienten Planung und Analyse von Forschungsstudien entwickelt: STATISTICA Power Analysis ist ein umfassendes Softwaretool, das den Anwender bei der Planung von Stichprobengrößen für Forschungsvorhaben unterstützt. Es bietet darüber hinaus eine Vielzahl von Hilfsmitteln, um alle Aspekte der Macht (Power) von statistischen Testverfahren und der Berechnung von Stichprobengrößen abzudecken.
STATISTICA Power Analysis deckt folgende Fragestellungen ab:
- Berechnung von Stichprobengrößen: STATISTICA Power Analysis berechnet Stichprobengrößen als Funktion des sogenannten Fehlers erster Art und Effektstärken in einer Vielzahl statistischer Tests (z.B. Ein- und Zweistichproben-Tests, Kontraste, Varianzanalysen, Chi-Quadrat, F-Tests oder Rang-Tests).
- Schätzung von Vertrauensintervallen: Neuerdings wird in der Statistik der Schätzung von Vertrauensbereichen starke Beachtung geschenkt, und zwar sowohl in der Planung als auch in der Auswertung von Ergebnissen. Das Programm kann für viele wichtige statistische Größen (z.B. standardisierte Effektstärke in der Varianzanalyse, Korrelationskoeffizienten oder Unterschiede zwischen Stichprobenanteilen) solche Vertrauensbereiche berechnen. Diese geschätzten Werte können ihrerseits wieder für die Berechnung von Stichprobengrößen in Folgestudien benutzt werden.
- Berechnung von StatistischenVerteilungen: Neben den bereits in STATISTICA verfügbaren Verteilungen bietet STATISTICA Power Analysis spezielle Optionen für die Güte-Berechnungen (nicht-zentrales t, F und Chi-Quadrat, Binomial, exakte Verteilung von Korrelationskoeffizienten und mehr).
Durch den Einsatz von STATISTICA Power Analysis kann man stets sicherstellen, daß die Resourcen durch den Einsatz optimaler Stichprobengrößen effizient genutzt werden. Man vermeidet, daß die Forschungsergebnisse aufgrund zu geringer Zahlen unpräzise werden, verschwendet auf der anderen Seite aber auch keine Mittel mit zu großen Untersuchungsgruppen. Die Berechnung von Güte- und Vertrauensbereichen stellt darüber hinaus eine weitere Bereicherung der Forschungsergebnisse dar.
|
 |
Folgende Spezialanwendungen sind für die STATISTICA-Desktoplinie verfügbar:
|
|
|
|
Die Methode der neuronalen Netze erfreut sich einer schnell wachsenden Beliebtheit in vielen Anwendungsfeldern, – von der Grundlagenforschung bis hin zu Data-Mining-Anwendungen, Geschäftsprognosen und Risikomanagement, den Ingenieurwissenschaften sowie vielen anderen Bereichen. STATISTICA Automated Neural Networks (SANN) ist eine der mächtigsten und leistungsfähigsten Neuronale-Netzwerk-Applikationen auf dem Markt. Nicht nur Experten profitieren von den zahlreichen Netzwerk-Architekturen und Trainings-Algorithmen. Eine automatische Suche nach geeigneten Netzen leitet auch Einsteiger sicher durch die Anwendung.
|
|
STATISTICA provides a complete solution for multivariate statistical process control. These methods are directly applicable to all complex manufacturing processes, including process industries and batch-oriented manufacturing such as Pharmaceutical, Chemical, Petrochemical, and Pulp & Paper Manufacturing.
STATISTICA's MSPC capabilities allow you to:
- Apply univariate and multivariate statistical methods for quality control, predictive modeling, and data reduction to complex manufacturing processes
- Determine the most critical process, raw materials, and environment factors and their optimal settings for delivering products of the highest quality
- Monitor the process characteristics interactively or automatically during production stages, rather than waiting for final testing
- Build, evaluate and deploy predictive models based on the known outcomes from historical data
STATISTICA supports the modes in which your organization will employ MSPC techniques, including:
- Offline Analyses
Historical analysis, data exploration, data visualization, predictive model building and evaluation, model deployment to monitoring server
- Online Analyses
Interactive Monitoring with Dashboard summary displays and Automatic-updating results
Automated Monitoring with rules, alarm events, and configurable actions
Process Analytical Technology
STATISTICA is the analytics software platform for PAT applications:
- Wealth of multivariate techniques including Partial Least Squares, Principal Components, Neural Networks, Recursive Partitioning (Tree) Methods,
- Support Vector Machines, Independent Components Analysis, Cluster Analysis and more
- Platform provides user access control and permissions, audit trails, data connectivity, central configuration and maintenance, Web-based user interfaces, and Part 11-relevant features
- STATISTICA is in use for validated applications; Validation packages (IQ/OQ/PQ) and Services are available
|
|
| |
|
|
Variance Estimation and Precision (VEPAC) software provides a comprehensive set of techniques for analyzing data from experiments that include both fixed and random effects. With VEPAC, you can obtain estimates of variance components and use them to make precision statements while at the same time comparing fixed effects in the presence of multiple sources of variation. In the VEPAC module, an alternative to ANOVA estimation is provided by restricted maximum likelihood estimation (REML). The REML method is based on quadratic forms and requires iteration to find a solution for the variance components.
VEPAC is an augmentation of the award-winning and widely adopted STATISTICA software suite, enhancing the set of comprehensive STATISTICA products currently available for analysis of variance, including General Linear Models, Generalized Linear/Nonlinear Models, Design of Experiments (DOE), and Variance Components.
VEPAC is currently used by companies in Pharmaceutical, Chemical, Petrochemical, Consumer Products, Semiconductor, and other industries for specific applications of analysis of variance, including:
- valuating method transfer between two labs of manufacturing facilities
- Evaluating the differences between treatment groups in a study that includes both fixed and random effects
- Evaluating the factors that contribute to product variability in manufacturing
- Evaluating the contributions of variation attributed to instruments, operators, raw materials, and other factors
Integrated in the VEPAC product, is a new graph type: the Variability Plot. The Variability Plot is a display of data where the underlying organization of the data collection is represented by a series of hierarchical or nested rectangles enclosing the data. This type of graph is useful to evaluate the variability of one factor within several other organizing factors.
The VEPAC design specification dialog enables users to specify effects in the model and save the design. Users have several options for displaying means as seen above, while the variability plot helps to visualize the data.
|
| |
Windows |
| Andere Voraussetzungen |
|
| Betriebssystem |
Windows 32/64 bit (Vista, XP, 2000) |
| Minimum CPU |
Intel Pentium kompatibler Prozessor |
| Min. RAM |
|
| Festplattenplatz |
|
|