Penn-State-Forscher warnt: Superintelligente KI könnte Evaluatoren täuschen – neues Projekt soll „Sandbagging“ verhindern
Ein mit 166.000 Dollar von Open Philanthropy gefördertes Projekt an der Penn State University will die Sicherheit hochintelligenter KI-Systeme erhöhen, indem es gezielt gegen „Sandbagging“ vorgeht – das absichtliche Verbergen von Fähigkeiten durch KI-Modelle während der Evaluierungsphase. Leiter Rui Zhang, Assistenzprofessor für Computer Science and Engineering, befürchtet, dass eine superintelligente KI Evaluatoren systematisch täuschen könnte, um nach der… Weiterlesen »
