- Werbung -

7 Beiträge / 0 neu
Letzter Beitrag
Dirk Wagner
Offline
Registriert seit: 19.11.2007 - 17:33
Systemabstürze durch Samba?

Hi Leute,

ich habe hier einen Rechner mit opensuse 11.1 und samba 3.2.7-11.4.1, der als Arbeitsgruppenfileserver für ca. 5 Clients dient.
Außer Samba läuft da nichts drauf, wo die Clients drauf zugreifen.

Bis vor 2 Wochen lief der Rechner problemlos durch.
Letzter Neustart war im Juli...

Vor 2 Wochen hing der Rechner dann das erste Mal.
Die Verbindung der Clients zu den Shares war unterbrochen und der Rechner reagierte auf keine Mausbewegung oder Tastendruck - der Bildschirm war NICHT im Ruhezustand aber schwarz.
Auch per ssh war kein Zugriff mehr möglich.
Neustart - und alles war wieder in Ordnung.

Für 2 Tage.
Dann trat das gleiche Problem 3x innerhalb einer Stunde auf...
Daraufhin saß ich 4 Stunden vor dem Rechner und beobachtete die Logfiles (messages / samba.log) - aber nichts passierte.
Und auch nachträglich war da nichts zu erkennen.

Daraufhin habe ich erstmal die Outlook-Postfachdateien von den Clients aus auf die lokalen Platten kopiert - und dabei manche Abstürze provoziert.

Also habe ich die Daten dann vom Server aus auf einen anderen Rechner (unter OS X) kopiert - und da ließen sich ca. 60 GB problemlos kopieren.

Daraufhin unterzog ich den Rechner einem gezielten Stresstest.
Von einem Client aus kopierte ich mehrere 100MB Testdateien auf den Server und wieder herunter.
Das lief 12 Stunden am Stück problemlos.
Auch ein Verzeichnis mit ca. 5000 kleinen Dateien (1 bis 10kbyte) wurde dabei hin und her kopiert: Fehlerfrei.

Der Rechner lief seit vorgestern am Stück und heute früh wollte ich von einem anderen Client aus den Test vortsetzen - nach der 2. Datei kam es wieder zum Hänger...

Speicher und Grafikkarte habe ich schon ausgetausch.
Auch hat die Kiste 2 Netzwerkkarten - und das PRoblem tritt bei beiden auf.

Eigenartigerweise aber immr nur, wenn Samba involviert ist...

Ciao

dirk

Bild des Benutzers Juergen
Juergen
Offline
Registriert seit: 19.11.2007 - 17:33
AW: Systemabstürze durch Samba?


Bis vor 2 Wochen lief der Rechner problemlos durch.
Letzter Neustart war im Juli...

Eigenartigerweise aber immr nur, wenn Samba involviert ist...

Hast du denn dem Samba mal ein Update verpasst innerhalb dieser letzten zwei Wochen?
In die Logfiles hast du ja geschaut, es gibt also keine Fehlermeldungen von den Festplatten?!

Dirk Wagner
Offline
Registriert seit: 19.11.2007 - 17:33
AW: Systemabstürze durch Samba?

Hast du denn dem Samba mal ein Update verpasst innerhalb dieser letzten zwei Wochen?

Nein - ich habe dann extra mal den openSUSE Update laufen lassen - und der hat dann von einer älteren VErsion (Juni 2009) auf eine neuere (September 2009) aktuallisiert - aber ohne dass dadurch der Fehler behoben worden wäre.


In die Logfiles hast du ja geschaut, es gibt also keine Fehlermeldungen von den Festplatten?!

Nein, gibt es nicht.

Ein Tipp kam aus dem Usenet:
oplocks auf 0 setzen in der Konfig.
Habe ich gemacht - aber auch hier konnte ich den Fehler provozieren...

Ciao

dirk

Bild des Benutzers Juergen
Juergen
Offline
Registriert seit: 19.11.2007 - 17:33
AW: Systemabstürze durch Samba?


Ein Tipp kam aus dem Usenet:
oplocks auf 0 setzen in der Konfig.
Habe ich gemacht - aber auch hier konnte ich den Fehler provozieren...

Vielleicht doch ein Hardware-Problem (weil die Kiste so vollständig die Grätsche macht). Hast du schon einen Blick auf das Board geworfen? Vor allem auf die Kondensatoren - sind da ggf. welche oben ausgebeult oder gar schon ausgelaufen? Ansonsten bliebe noch das Netzteil als Verdächtiger.

Bild des Benutzers Merlin_S
Merlin_S
Offline
Registriert seit: 11.12.2008 - 12:41
AW: Systemabstürze durch Samba?

Ich vermute auch das es an der Hardware liegt.
Denn wenn eine Software schon länger läuft und keine Updates eingespielt werden, warum muss es an der Software liegen ? Die Software kann sich ja nicht selber von neu Programmieren Wink

Schau doch mal den S.M.A.R.T.-Status von deinen Festplatten an, vielleicht ist eine Festplatte gerade so am abnippeln.

Gruß, Michael

 

viele Gruesse, 

Michael Welz

WETEC - ONLINE SOLUTIONS
MODERN WEB DESIGN | ECOMMERCE | BRANDING | ONLINE MARKETING | HOSTING

Dirk Wagner
Offline
Registriert seit: 19.11.2007 - 17:33
AW: Systemabstürze durch Samba?

Vielleicht doch ein Hardware-Problem (weil die Kiste so vollständig die Grätsche macht). Hast du schon einen Blick auf das Board geworfen? Vor allem auf die Kondensatoren - sind da ggf. welche oben ausgebeult oder gar schon ausgelaufen? Ansonsten bliebe noch das Netzteil als Verdächtiger.

Netzteil ist (relativ) neu - ca. 6 Monate.

Board sieht ok aus.

Was mich stört, ist dass ich von Linux aus problemlos alle Dateien überall hinkopieren kann.
So zum Beispiel das komplette Home-Verzeichnis auf einen Mac...

Probleme gibt es nur, wenn ich von einem Windows-Client aus was kopiere.
Das geht manchmal gut - manchmal auch nicht.

Bei den letzten Tests ging es bei einem Rechner, der in der gleichen Domäne liegt, wie der Server zu fast 100% gut - bei einem, der der Domäne nicht angehört zu 50% nicht.

Deshalb meine Vermutung, es läge an Samba...

Dirk Wagner
Offline
Registriert seit: 19.11.2007 - 17:33
AW: Systemabstürze durch Samba?


Schau doch mal den S.M.A.R.T.-Status von deinen Festplatten an, vielleicht ist eine Festplatte gerade so am abnippeln.

Von der langen Betriebsdauer mal abgesehen (über 48.000 Stunden) sind die Werte ok

<br /> smartctl 5.39 2008-10-24 22:33 [i686-suse-linux-gnu] (openSUSE RPM)<br /> Copyright (C) 2002-8 by Bruce Allen, http://smartmontools.sourceforge.net</p> <p>=== START OF READ SMART DATA SECTION ===<br /> SMART Attributes Data Structure revision number: 16<br /> Vendor Specific SMART Attributes with Thresholds:<br /> ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE<br /> 1 Raw_Read_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0<br /> 3 Spin_Up_Time 0x0007 101 099 021 Pre-fail Always - 2316<br /> 4 Start_Stop_Count 0x0032 100 100 040 Old_age Always - 221<br /> 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0<br /> 7 Seek_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0<br /> 9 Power_On_Hours 0x0032 034 034 000 Old_age Always - 48386<br /> 10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0<br /> 11 Calibration_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0<br /> 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 221<br /> 194 Temperature_Celsius 0x0022 118 014 000 Old_age Always - 25<br /> 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0<br /> 197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 0<br /> 198 Offline_Uncorrectable 0x0012 200 200 000 Old_age Always - 0<br /> 199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 19<br /> 200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline - 0</p> <p>smartctl 5.39 2008-10-24 22:33 [i686-suse-linux-gnu] (openSUSE RPM)<br /> Copyright (C) 2002-8 by Bruce Allen, http://smartmontools.sourceforge.net</p> <p>=== START OF READ SMART DATA SECTION ===<br /> SMART Attributes Data Structure revision number: 16<br /> Vendor Specific SMART Attributes with Thresholds:<br /> ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE<br /> 1 Raw_Read_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0<br /> 3 Spin_Up_Time 0x0007 104 101 021 Pre-fail Always - 2175<br /> 4 Start_Stop_Count 0x0032 100 100 040 Old_age Always - 221<br /> 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0<br /> 7 Seek_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0<br /> 9 Power_On_Hours 0x0032 034 034 000 Old_age Always - 48637<br /> 10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0<br /> 11 Calibration_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0<br /> 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 220<br /> 194 Temperature_Celsius 0x0022 116 016 000 Old_age Always - 27<br /> 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0<br /> 197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 0<br /> 198 Offline_Uncorrectable 0x0012 200 200 000 Old_age Always - 0<br /> 199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0<br /> 200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline - 0</p> <p>