SSDs mit 0% Restlebensdauer/TBW Erreicht - Ein Erfahrungsbericht, Intel X25-M G2 Postville, Samsung PM9A1 (eine Art 980 Pro) Diskussion erwünscht

Herr Moehre

Rather active member
Themenstarter
Registriert
17 Dez. 2013
Beiträge
2.190
Hallo liebes Forum,

einige von euch werden sich vielleicht noch an das "SSD Endurance Experiment" von Techreport erinnern, der vor ca. 10 Jahren gestartet ist und - deutlich länger als erwartet - nach über einem Jahr und über 2,5 PBW endete, was einen Meilenstein gegen die landläufige Meinung "um Gottes Willen nicht zu viel auf eine SSD schreiben und am besten temporäre Dateien etc. auf HDD oder RamDisk auslagern, die gehen so schnell kaputt" darstelle.

Wohlgemerkt geschah dies bei einer 256 GB MLC SSD, wir reden hier nicht von mittlerweile geläufigen 4 oder gar 8 TB.
Die damals "neuen" TLC SSDs haben auch eine extrem hohe Schreibbelastung überstanden.


Irgendwie ist danach ziemlich ruhig um das Thema geworden, jedenfalls meinen Recherchen nach, was ja eigentlich ein gutes Omen ist, wenn die Dinger nicht aufgrund degradierten Flash Zellen Probleme machen oder ganz ausfallen.
Mal abgesehen von Bitrotting-Serienfehlern, wie damals bei der 840 EVO / PM841 & PM851 oder vereinzelte Meldungen zum aktuellen YMTC Flash.

Verschlissene Flash Zellen können ggfls. schwerer ausgelesen werden, sodass sich dies auf die Leseperformance auswirken kann.

Deshalb möchte ich meine Erfahrungen einmal hier dokumentieren, falls sich jemand anschließen möchte oder Fragen hat, gerne tun.
Ich schiele an der Stelle zu @cuco rüber, lebt deine SSD noch? Mein letzter Stand waren rd. 2200 TBW im März diesen Jahres?

Crucial V4 32 GB:

Eine absolut langsame (Schrott) SSD aus der späteren Frühphase des SSD Zeitalters, Cacheless und schnarchlahm. Diese habe ich bereits ~2014 rum zum Spaß totgeschrieben.
Angegeben war diese mit 36 TBW (egal bei welcher Größe, gab es bis 256 GB).
Diese 36 TBW habe ich bei einer halbvollen SSD dann mal drauf geschrieben, kam am Ende auf 40 TBW.

Hatte keine Schreibfehler, S.M.A.R.T. war auch noch nicht auffällig, aber ein Test mit Badblocks war schon ziemlich sehr fehlerhaft.
Wurde dann von mir in der Firma als Anschauungsobjekt für Praktikanten verwendet.

Intel X25-M G2 Postville 160GB:

Die erfahrenen Rotknubbel-Hasen hier im Forum werden sich bei dem Gedanken an dieses Stück Blech mit einem 10x16GiB Flash Zellen "Raid" nostalgisch erinnern.
Ich glaube das war die erste MLC SSD von Intel, als Nachfolger der X25-E mit SLC Zellen (bei 64 GB mit 2 PWB ! angegeben) in einigen Thinkpads zu finden.

Zwei Exemplare sind in meinen Händen, eine im Einsatz, eine wechselt den Besitzer, kommen ursprünglich aus dem Serverumfeld.

Angegeben sind die SSDs mit 15 TBW, Beide SSDs haben rund 90 Terabyte geschrieben, also rund das Sechsfache der damals (ängstlichen) Herstellerangabe.

Mit einer Restgesundheit von 86% bei über 15 Jahren auf dem Buckel und davon über 7,5 Jahren Betrieb lässt sich das gut sehen.
Fehler sind bei beiden SSDs - bis auf ein paar Reallocated Sectors - nicht vorhanden, h2testw ist unauffällig, auch nach einigen Tagen Haltedauer.
Diese Lese- und Schreibperformance würde ich als "wie neu" bezeichnen.

Postville_V2.png

Samsung PM9A1 - die OEM Version der 980 Pro - NVMe PCI-E 4.0 1024 GB Restgesundheit 0%:

Ich habe hier mehrere SSDs dieser Art, stammen aus Farming-Systemen und haben alle etwa 850 TBW (+/- 10 TB) bei angegebenen 600 TBW.
Diese große Belastung ist ohne nennenswerte Zyklung der SSDs geschehen, zu den Folgeproblemen später mehr.

Die SSDs sind relativ neu, zum Zeitpunkt (Dezember 2024) meines Posts 13 bzw. 18 Monate lt. aufgeklebtem Sticker.
Alle SSDs sind soweit bis auf vereinzelte "Critical Warning" und dem Erreichen der bis zu über 200% der prozentualen Lebensdauert noch fehlerfrei.
Selbst von den Reservesektoren wurde noch kein einziger verwendet.

Bei allen war H2testw mit mehreren Durchläufen fehlerfrei ohne Auffälligkeiten oder langsamer Leseperformance.

Ich habe hier vor, diese SSDs einem längerfristigen Test zu unterziehen, sodass ich eine in mein X390 als Ersatz meiner WD Black SN750 1 TB gepackt habe und alltäglich als Zweitrechner zum Surfen verwende.
Die Dinger sind echt schnell.. das Betanken ging im Nu.. Gut, sind auch mit etwa 2000 MB/s (980 Pro ca. 2200 MB/s) Dauerschreibleistung nach erschöpftem SLC Cache angegeben^^

II.png

Dadurch, dass die SSDs praktisch 850 Terabyte lang ohne Pause liefen hatten die Teile keiner 5 Einschaltzyklen hinter sich.
Die im Forum, die sich damit auskennen, wissen, dass durch die Einschaltzyklen und u.a. den verbundenen Temperaturänderungen sich die Bauteile ausdehnen bzw. zusammenziehen, was zu Defekten führen kann. Ich hatte eine SSD dabei, die wurde später erkannt, als die anderen.. oder (beim X390) an dem USB-C Anschluss gar nicht, nur am Thunderbolt 3 Anschluss. Mit gleichem Gehäuse und einer anderen SSD war das nicht so.

Es musste also kommen, wie es kommen musste. Die ursprünglich geplante SSD, die ins X390 sollte wurde:

- per USB-C Gehäuse stundenlang mittels h2testw getestet ohne Fehler
- war bis auf die 0% Restlebensdauer fehlerfrei in S.M.A.R.T.
- wurde umgebaut
- mit den Daten betankt
- mit mehreren Neustarts wieder lauffähig gemacht (Grub-Install, Windows etc.)...

...und startete dann nicht mehr mit der SSD.
Konnte ich noch ich glaube 2 Mal im X390 reaktivieren, startete und lief ohne Probleme, danach bliebt das X390 im BIOS hängen mit der SSD.
Auch im Gehäuse etc. ist diese seither tot.

Das waren die Daten (sorry für die schlechte Qualität, war noch ganz zu Beginn meines Tests):

I.jpeg


Ich bin derzeit am überlegen, was ich mit den restlichen SSDs anstelle. Derzeit liegt eine hier erst einmal herum und darf ihre Daten altern, bis ich dann wieder per h2testw einen Integritätstest durchführe.

Die Lesegeschwindigkeit kann ich mangels PCI-E4.0 nicht korrekt testen, allerdings habe ich bei keinen der SSDs bisher überhaupt Einbrüche in der Lese- oder Schreibperformance sehen können.

Wie ist eure Meinung zu dem Thema, würdet ihr diese SSDs (mit Backup) noch einsetzen oder wäre es euch zu heikel?
Gebt mir gerne Feedback dazu, auch wie ihr das Thema an sich findet.
 
Zuletzt bearbeitet:
Manchmal ist das auch einfach das Alter.. ich hatte vor letztes Jahr ein T420 bei eBay gekauft mit einer 830 Samsung SSD drin.
Die hat den Lesetest nicht geschafft, die Daten darauf waren mittels LUKS verschlüsselt und älter.
Nach einem
shred -n -vz /dev/sdX
ging es wieder.

Viel Spaß beim Testen.

@cuco spannend finde ich, dass deine SSD eigentlich das Doppelte der 1,2 PB Schreibleistung geschafft hat, aber erst 107% used ist.
Ich vermute, dass dein System komprimierbare Daten nutzt, die die SSD zugunsten der Flash Zellen gut komprimieren kann.
Bei einigen (älteren) SSDs gab es zwei Messwerte, Total Bytes Written und Total NAND Written, war ganz spannend, wenn das Alignment (die alten Hasen erinnern sich) nicht passte, dann wich die NAND Written Angabe nach oben ab.
 
Wäre eine Vermutung, aber das ist alles ein ZFS mit eingeschalteter Komprimierung (LZ4). Die Komprimierung geschieht also schon vor dem Schreiben auf den Datenträger.
 
Jo, das ist dann alles Glaskugelei, andere Option wäre, dass der SLC Cache da noch mit reinfunkt.
Jedenfalls hast du meinen Respekt, bzw. deine 970 Evo Plus.
 
@Megalodon du kannst dich gerne bald zum Mitbieten einreihen, falls du willst. Ich werde wahrscheinlich die Tage eine funktionsfähige SSD als Spendenaktion reinsetzen.

Zurück zu meiner toten SSD, ich habe diese heute im NVMe Gehäuse erfolglos angeschlossen, da diese noch immer warm wird, dachte ich ich lasse sie mal eingesteckt.
Nach 10-15 Minuten (ggfls. länger) habe ich das Teil neu eingesteckt und sie wurde wieder erkannt.

Hat dann shred Zyklen durchgemacht, ist dabei wohl 2-3 Male kurzzeitig ins Stocken geraten, aber ganz ohne weitere Mucken durch gelaufen.

Habe diese dann auskühlen lassen und ein paar Stunden später angeschlossen und Windows gestartet:

I.png

Habe dann h2testw augeführt und das Ding gecheckt, dabei ist sie mir dann wieder gestorben:

I_TOD.png

Habe die SSD zum Spaß in ein bekanntes Auktionshaus inseriert, als Auktion und zum Sofort-Kaufen Preis.
Natürlich als Defekt (auch in der Überschrift sowie Beschreibung mit Details), keine 30 Minuten später wurde sie mir abgekauft..
Ist mein Vertrauen in die Menschheit jetzt wiederhergestellt oder das Gegenteil? :D
 
Ich habe hier in einem System 5 Stück Intel SATA-SSD D3-S4510 Series 960GB SATA 6G 2,5" - J80327-001 SSDSC2KB960G8 als RaidZ1 im Einsatz. Dauerläufer, in einem NFS Server für nen ESXi Hobel. Um die 47261 Power_On_Hours, also fast 5 1/2 Jahre, unter 30 Powercycles :)

NAND_Writes_32MiB steht bei ca. 850.000, wenn ich mich nicht verrechne dann sind das ca. 26 TiB written. Angegeben sind die SSDs mit 3.5 PBW, da ist also noch gut Luft :) Eine der SSDs hat einen reallocated sector und 99% reserved space available, alle anderen noch bei 100%.

Hätte gedacht das die SSDs nach dem langen Einsatz und der Last von >20 VMs weitaus mehr runtergerockt sind. So muss ich mir echt mal noch ne Anschlussverwendung suchen wenn das Konstrukt jetzt in Rente geht (VMWare vs. Proxmox und so).
 
Das sind schon gute Werte, Respekt!

Laut Thomas-Krenn Wiki haben die "nur" 1,3 PWB: https://www.thomas-krenn.com/de/wiki/Intel_D3-S4510_M.2_Series_SSDs

Wer von euch beiden hat Recht?

Falls alle Stricke reißen, könntest du diese in meinen Augen als günstige USB Sticks verwenden / veräußern.
Die Schreibgeschwindigkeit lässt sich ja gut sehen und ist bei größeren Datenmengen noch immer den günstigeren (oder auch kleineren) NVMes meist deutlich überlegen.

So China Gehäuse für M.2 S-ATA kosten knapp 5€ das Stück.. für NVMe ist es mehr.
Also die Billigsten..
 
Ich verlies mich auf den Hersteller :) https://www.solidigm.com/products/data-center/d3/s4510.html

Dort sind für die 2.5" Version der 960 GB SSD (die ich habe) 3.5 PBW genannt, für die M2 Variante die bei TK gemeint ist 2.3 PBW. Lustig das es da nen Unterschied gibt.

Und ne, ich werde die eher nicht verkaufen. Der aktuelle Plan ist (bei einem kleinen Mittelständler) die Kombination von NFS- und ESXi-Server durch zwei Proxmox Server als HA Cluster mit je 2*4 TB NVME im ZFS Mirror zu ersetzen, und aus der übrig werdenden Althardware nen PBS zu bauen. Da habe ich im aktuellen ZFS send/receive Backuphobel 3 12TB HDDs als threeway Mirror, denke ich werde die 5 Intel SSDs dann da verwursten (2 als neue Boot-SSDs/Mirror, und 3 als ZFS Special Device, da soll der PBS massiv von profitieren hörte ich).

Muss nur noch klären ob der PBS auch normale ZFS send/receives kann ohne aus dem Tritt zu kommen :) Aber genug Offtopic in der Richtung :)


Zum Thema SSDs fällt mir noch ne kleine NetApp ein, mit 18*960 GB SSDs bestückt, das System ist ebenfalls 5 Jahre alt. Das genaue SSD Modell ist NetApp X371, müsste wenn ich mich recht erinnere eine Samsung PM1635a mit custom firmware sein, SAS, 12GBit. Wear Level bei 3-4%. Gegen das System arbeiten 4 ESX Hosts mit zusammen 140 VMs. Auch eher unkaputtbar, denke da geht eher das System EOL als das die SSDs aussteigen.
 
Durch den "Wie viel TBW hat euer TP pro Monat"-Thread bin ich mal wieder hier drauf gestoßen und daher ein kurzes Statusupdate:
Code:
SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x04
Temperature:                        54 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    115%
Data Units Read:                    3,755,521,144 [1.92 PB]
Data Units Written:                 5,129,736,298 [2.62 PB]
Host Read Commands:                 30,003,184,324
Host Write Commands:                32,025,652,107
Controller Busy Time:               56,598,603
Power Cycles:                       67
Power On Hours:                     29,624
Unsafe Shutdowns:                   43
Media and Data Integrity Errors:    0
Error Information Log Entries:      147
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               54 Celsius
Temperature Sensor 2:               68 Celsius
Oder anders gesagt: Die Samsung 970 Evo Plus 2TB SSD lebt weiterhin.
Allerdings habe ich mir vor ein paar Wochen endlich mal ein 19"-Rack und ein vernünftiges 19"-Gehäuse bestellt. Wenn ich den Umbau des Servers vornehme, könnte ich auch endlich mal die SSD tauschen. Eigentlich schade - ist doch noch fast wie neu mit 100% "available spare" ;) Na gut, die 115% used sprechen etwas dagegen. ^^ Jedenfalls hat die SSD nun 2.620 TBW. In den letzten 13 Monaten sind also nur 190TBW dazugekommen.
Einziges Problem beim Einbau der neuen SSD dürfte sein, dass ich keine Ahnung habe, wo ich sie eigentlich gelassen habe. Dürfte immerhin schon seit 5 Jahren bereit liegen und in der Zwischenzeit bin ich auch schon umgezogen...
 
Geiler Scheiß! Was macht die SSD, wenn sie dann in Rente geht?


Ich habe zwei der PM9A1 noch im Einsatz, eine hab ich ja ins Forum als Spendenaktion abgegeben, die andere war defekt.
Beide haben ca. 190-210% Used, eine läuft produktiv in meinem X390 Yoga als System-SSD, die andere nach langer externer SSD-Zuständigkeit nun als Steam Library im T15g Gen 2.
Komplett ohne Probleme, das größe Problem ist, dass der Intel Raid Spinner unter Windows immer vor den schlechten SMART Werten warnt, selbst wenn ich ihm sage, er soll diese ignorieren. :D
 
Geiler Scheiß! Was macht die SSD, wenn sie dann in Rente geht?
Gute Frage... Auf der einen Seite weiß ich nicht, was ich ihr noch sinnvoll anvertrauen sollte. Auf der anderen Seite wüsste ich nicht, was dagegen spricht, so lange die restlichen SMART-Werte noch immer so gut aussehen. Aber ich glaube, ich habe einfach auch gerade kein Gerät, wo ich sie sinnvoll reinsetzen könnte. Alles andere ist ebenfalls schon mit SSDs ausgerüstet... Vielleicht verkaufe ich sie dann auch hier im Forum weiter, evtl. kann noch jemand was damit anfangen. Aber das sehen wir dann. Wenn sie getauscht ist. Vielleicht schiebe ich das doch noch weiter vor mir her, bis sie wirklich aufgibt :D
 
Also für Spielebibliotheken sind die Dinger echt dankbar.. Performance, Kapazität und wenn was passiert, ist das halb so wild... ich denke da wird sich schnell ein Abnehmer finden.
Habe meine 1 TB auch gut vollgeballert, ansonsten für den kurzfristigen schnellen Datentransfer in ein NVMe Gehäuse packen, falls gewünscht.
 
Klar. 2B2QEXM7 ist laut smartctl installiert.
Interessant, ja die habe ich auch. Allerdings gibt es es ein Update, das scheinbar schon länger raus ist. Die beginnt mit 4B2..

Wie so oft scheitert es an der Transparenz vieler Hersteller, die nicht immer offenlegen welches Problem das Update zu beheben gedenkt.
 
Ich hab's eben auch mal gegoogelt. Wenn ich das richtig verstehe, ist 2Bxx aktuell, es gab aber Laufwerke mit einer 3Bxx-Firmware, die ein Update auf 4Bxx erfordert. Die 2Bxxer können aber wohl nicht auf 4Bxx geupdatet werden.
Ich schließe daraus, dass es zwei Möglichkeiten gibt: Entweder gibt es zwei unterschiedliche Revisionen des Controllers. Der eine braucht Firmware 2Bxxx, der andere 4Bxxx. Oder, Möglichkeit 2, es gab eine Firmware mit 3Bxx, die eine Regression gegenüber 2Bxxx enthielt. Das wurde rückgängig gemacht. Das Update musste nun aber eine höhere Versionsnummer haben als die "kaputte" 3Bxxx-Firmware. Daher könnten 4Bxxx und 2Bxxx evtl. identisch sein, nur die Nummer von 4Bxx ist halt höher, damit das Update von der 3Bxx klappt.
Aber nur meine Vermutungen.
 
Von den alten, damals teuren Sticks, ist ist noch kein einziger verstorben...
es gibt diese Sticks mit Metallklappbügel (sieht wie ein dünnes U aus) zum Schutz des USB Steckers, davon sind mir inzwischen zwei defekt, meist als Werbegeschenk der noch überlebende dieser Sorte hat 1GB);
 
Entweder gibt es zwei unterschiedliche Revisionen des Controllers. Der eine braucht Firmware 2Bxxx, der andere 4Bxxx.
Ja das scheint hier tatsächlich der Fall zu sein. Es gab die ersten 970 Evo Plus mit dem Phoenix Controller und dann kam die Elpis-basierte Revision heraus. Es ist naheliegend, dass Samsung dafür die 3Bxxx FW Bezeichnung genommen hat. Ein Faden im ComputerBase Forum hat auch ähnliches zu Tage gefördert.

Schade, ich hatte gehofft, dass ich damit den Error Counter stoppen kann, der unter "Preserved Error Information Log Entries" kontinuierlich nach oben zählt ohne auf eine echte Gefahr hinzuweisen.
 
  • ok1.de
  • IT Refresh - IT Teile & mehr
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben