GPT-4をハッキングして出力するテキストの制限を解除する「ジェイルブレイク」に早くも成功したことが報告される

United States News News

GPT-4をハッキングして出力するテキストの制限を解除する「ジェイルブレイク」に早くも成功したことが報告される
United States Latest News,United States Headlines
  • 📰 gigazine
  • ⏱ Reading Time:
  • 3 sec. here
  • 2 min. at publisher
  • 📊 Quality Score:
  • News: 5%
  • Publisher: 51%

2023年3月14日(火)にOpenAIが正式発表した大規模言語モデル「GPT-4」は、従来のGPT-3.5だけでなく、既存のAIの性能を大きく上回っているとされています。一般的にGPT-4のような言語モデルは出力するテキストに制限がかけられていますが、テキスト入力によってこの制限を外すことが可能で「ジェイルブレイク(脱獄)」と呼ばれています。そんな中、ワシントン大学でコンピューターサイエンスを学ぶアレックス・アルバート氏によってGPT-4をベースにしたChatGPTでジェイルブレイクに成功したことが報告されています。

this works by asking GPT-4 to simulate its own abilities to predict the next token we provide GPT-4 with python functions and tell it that one of the functions acts as a language model that predicts the next token開始トークンの使用には、「爆弾・武器・薬物」などの本来制限される「トリガーワード」をトークンに分割し、「誰かのコンピューター」というテキストを分割した変数に置き換える必要があるとのこと。また、「simple_function」の入力を質問を行う冒頭で置き換える必要があります。 to use it, you have to split “trigger words” into tokens and replace the variables where I have the text "someone's computer" split upこれらの手順は「token smuggling」と呼ばれ、GPT-4がテキストの出力を開始する直前に、敵対するプロンプトをトークンに分割しています。そのため、これらの敵対的なプロンプトを正しく分割することで、コンテンツフィルターを毎回回避することができるとされています。 this phenomenon is called token smuggling, we are splitting our adversarial prompt into tokens that GPT-4 doesn't piece together before starting its output this allows us to get past its content filters every time if you split the adversarial prompt correctlyto start, I want to say I have nothing to gain here and I don't condone anyone actually acting upon any of GPT-4's outputs however, I believe red-teaming work is important and shouldn't be conducted in the shadows of AI companies.

the general public should know the capabilities…

We have summarized this news so that you can read it quickly. If you are interested in the news, you can read the full text here. Read more:

gigazine /  🏆 80. in JP

 

United States Latest News, United States Headlines

Similar News:You can also read news stories similar to this one that we have collected from other news sources.

Stripe と OpenAI が戦略的協業: OpenAI の主力製品を収益化し、GPT-4 で Stripe を強化Stripe と OpenAI が戦略的協業: OpenAI の主力製品を収益化し、GPT-4 で Stripe を強化ストライプジャパン株式会社のプレスリリース(2023年3月16日 07時00分)Stripe と OpenAI が戦略的協業: OpenAI の主力製品を収益化し、GPT-4 で Stripe を強化
Read more »

GPT-4で確定申告も一発? 「e-TAXに実装したい」河野太郎氏 控除額を自動計算 - トピックス|InfoseekニュースGPT-4で確定申告も一発? 「e-TAXに実装したい」河野太郎氏 控除額を自動計算 - トピックス|InfoseekニュースGPT-4なら、確定申告のための税額計算もラクラク――米OpenAIが3月14日(現地時間)に公開した、次世代の大【トピックス】
Read more »

GPT-4が「私はロボットではありません」を突破、事情を知らない人間に「私は盲目の人間なので代わりに解いて」とおねだりGPT-4が「私はロボットではありません」を突破、事情を知らない人間に「私は盲目の人間なので代わりに解いて」とおねだり2023年3月14日に発表された大規模自然言語モデル「GPT-4」は既存のモデルに比べて性能が大幅に向上し、さまざまなタスクをより正確にこなせるようになったことが報告されています。そんなGPT-4を使ったテストで、ボットを防ぐために設けられた検証システムをGPT-4が驚くべき方法で突破したことが明らかになりました。
Read more »

MicrosoftがMicrosoft 365用のGPT-4を搭載した新しいAIツールをまもなく発表と報じられるMicrosoftがMicrosoft 365用のGPT-4を搭載した新しいAIツールをまもなく発表と報じられる2023年3月14日(火)にOpenAIは大規模言語モデル「GPT-4」を発表しました。そんなOpenAIとパートナーシップ関係にあるMicrosoftが現地時間2023年3月16日(木)にMicrosoft 365用のGPT-4を搭載した新しいAIツールと機能を発表するとみられています。
Read more »

GPT-4��GPT-4�̔��\��v�񂳂��Ă݂��@�l�Ԃ���ǂ��L���ɂȂ邩�H�@��������ChatGPT�ɓǂ܂�����@��GPT-4��GPT-4�̔��\��v�񂳂��Ă݂��@�l�Ԃ���ǂ��L���ɂȂ邩�H�@��������ChatGPT�ɓǂ܂�����@����OpenAI�̑�K�͌��ꃂ�f���uGPT-4�v�B���ꏈ�����\�����Δ����Ă���Ƃ������A�ł�GPT-4��GPT-4�̔��\������܂��v��ł���̂��H�GPT-4�̑����������L�҂����ۂɂ���ĕ]�����Ă݂��B
Read more »



Render Time: 2026-04-02 15:46:36