Legenda: Chondryty zwyczajne typu H (■),
L (♦), LL (●) oraz wartości średnie
i centroidy klastrów (+)
oliwin vs. metal (wykres sporządzony w pakiecie
statystycznym R)
piroksen vs. metal (wykres sporządzony w pakiecie
statystycznym R)
troilit vs. metal (wykres sporządzony w pakiecie
statystycznym R)
piroksen vs. oliwin (wykres sporządzony w pakiecie
statystycznym R)
piroksen/oliwin vs. (piroksen+metal)/(oliwin+troilit)
(wykres sporządzony w pakiecie statystycznym R)
Varia. Kombinacje piroksen+metal/oliwin+troilit i inne
(wykresy sporządzone w pakiecie statystycznym R)
Pairs
Wykres wszyscy-ze-wszystkimi (pairs)
(wykres sporządzony w pakiecie statystycznym R)
Ellipses
Wykres ellipse (wykres sporządzony w pakiecie
statystycznym R)
(wielkość elips odpowiada poziomowi istotności 95% – 1,96σ)
Voronoi diagrams
Voronoi diagram. Wykres zainspirowany opisywanymi w
literaturze pomysłami prostego podziału przestrzeni cech na rozłączne obszary zawierające
meteoryty tylko jednego typu. Pierwotnie pomysł zaproponował Verma et al., a nadal rozwija go
Oshtrakh et al. (sources)
(wykres sporządzony w pakiecie statystycznym R)
Specjalnie dla naszych miłych Pań – "robak Woronoja"
(BASE vmax (left), BASE v2n
(right))
Ternary
Wykres trójkątny (ternary plot) na którym doskonale
widać potencjał dyskryminacyjny parametrów mössbauerowskich
(wykres sporządzony w pakiecie statystycznym R)
Density, box and whisker
Wykresy density – wykresy oszacowania gęstości rozkład
danych. Podobnie jak histogram, podsumowuje się zależność między wartościami parametrów a liczbą
obserwacji, ale zamiast częstotliwości podsumowuje się ją jako ciągłą funkcję gęstości
prawdopodobieństwa (probability density function, PDF). Jest to prawdopodobieństwo, że dana
obserwacja ma określoną wartość. Wykresy box and whisker – wykresy pudełkowe i wąsy podsumowują rozkład danego
parametru; pokazują ramkę dla 1 i 3 kwartyla, linię w ramce (?!) dla 50. centyla (medianę) i kropkę
dla średniej. Wąsy pokazują 1,5 × wysokość prostokąta (zwanego przedziałem między kwartylami, interquartile
range, IQR), co wskazuje oczekiwany zakres danych, a wszelkie dane poza tymi wąsami są uznawane za
wartości odstające i oznaczone kropką.
(wykres sporządzony w pakiecie statystycznym R)
PCA – Principal Component Analysis
Principal Component Analysis (PCA) (v.08-2023#230
- 55.9, 23.0, 20.6, 0.5%)
BASE points classification – Bayes classification
rule (pie) (validation, training ≡ testing set)
weryfikacja, zbiór testowy ≡ zbiór uczący
Bardzo dobra trafność (accuracy) klasyfikacji! Patrz również → symulacje
BASE points classification – Bayes classification
rule (pie) (k-fold cross-validation LOOCV, training ≠ testing set)
k-krotny sprawdzian krzyżowy, zbiór testowy ≠ zbiór uczący
Bardzo dobra trafność (accuracy) klasyfikacji!
BASE points classification – 4M-method (pie)
(validation, training ≡ testing set)
weryfikacja, zbiór testowy ≡ zbiór uczący
Rewelacyjna trafność (accuracy) klasyfikacji!
(klasyfikacja nienadzorowana metodą k-medoids miała
dużo gorszy współczynnik trafności accuracy ~80%) Patrz również → symulacje
Symulacje testowych baz (losowe zbiory 1000 próbek dla
każdego typu) klasyfikowane metodą 4M dawały wynik trafności (accuracy) w
przedziale 88-92%; klasyfikowane Bayes classification rule dawały wynik trafności (accuracy)
w przedziale >92% (91,43-93,13)
(v.08-2023#230 - 90.37% i 93.17%)
(wykres sporządzony w pakiecie statystycznym R)
Wykres aglomeracyjny (cluster analysis) na którym widać
potencjał dyskryminacyjny parametrów mössbauerowskich (różne
metody aglomeracji)
(wykres sporządzony w pakiecie statystycznym R)