ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
無料
ブラウザよりも高速アクセス!
 

Bzip2

索引 Bzip2

bzip2(ビージップツー)は、データ圧縮プログラムのひとつ、およびその圧縮データのフォーマットである。 により開発され、その実装(プログラム)のライセンスは BSD-style である。1996年6月に最初に公開され、その後の数年間で動作安定性と人気とが高まった。2000年末にversion 1.0が発表された。bzip2圧縮プログラムを用いて処理されたファイルには、拡張子として標準的には.bz2」が付けられる。アーカイブ機能はない。 bzip2は、より効率的な圧縮のためにブロックソート法(バロウズ-ホイラー変換)とMTF (Move-To-Front) 法、ハフマン符号化法を用いており、従来のgzipやZIPといったデータ圧縮法と比べ、より高い圧縮率を誇っている。また、bzip2の操作法は意図的にgzipに似せてあり、gzipからの移行は容易である。しかしながら、bzip2は処理速度の点でgzipよりも劣っており、gzipを完全に置換するには至らず、また高圧縮率のフォーマットとしてはxzも登場している。しかし、StuffItや7-Zipといった高圧縮プログラムと比べれば圧縮率もそこそこ良い割に高速に動作する。 bzip2は、ネットワーク経由で配布される比較的サイズの大きなファイルの圧縮に用いられることが多く、代表的なものとしては、Linuxカーネルのソースコード群が挙げられる。 bzip2の原型である bzip は圧縮アルゴリズムに算術符号を利用しているため、算術符号関係の特許による制約のために開発が継続不能とされた、という経緯がある。.

17 関係: ハフマン符号ブロックソートプログラム (コンピュータ)データ圧縮ファイルフォーマットアルゴリズムアーカイブ (コンピュータ)算術符号特許GzipLinuxカーネルMove To FrontStuffItXz (ファイルフォーマット)ZIP (ファイルフォーマット)拡張子7-Zip

ハフマン符号

ハフマン符号(ハフマンふごう、Huffman coding)とは、1952年にデビッド・ハフマンによって開発された符号で、文字列をはじめとするデータの可逆圧縮などに使用される。 ほかのエントロピー符号と同様、よく出現する文字には短いビット列を、あまり出現しない文字には長いビット列を割り当てることで、メッセージ全体の符号化に使われるデータ量を削減することを狙っている。 コンパクト符号やエントロピー符号の一つ。JPEGやZIP (Deflate) などの圧縮フォーマットで使用されている。 シャノン符号化が最適ではない場合が存在する不完全な符号であったのに対し、ハフマン符号は(整数の符号語長という制約のもとでは、)常に最適な符号を構成できる。擬似的に実数の符号語長を割り振る算術符号と比較すれば、データ圧縮効率は劣る。ただし、算術符号やその他の高効率の符号化法と異なり、特許の問題が無い。.

新しい!!: Bzip2とハフマン符号 · 続きを見る »

ブロックソート

ブロックソート、ブロックソーティング、Burrows-Wheeler変換 (Burrows-Wheeler Transform; BWT) は、1994年にマイケル・バローズ (Michael Burrows) とデビッド・ホイーラー (David Wheeler) が開発した可逆変換の方式で、データ圧縮の前処理に応用される。 ブロックソート自体はデータの大きさを変えない。しかし、データを整列することでデータ中に出現するパターンを、いくつかのよく知られている手法で圧縮し易いものにできる。後処理としてMove To Front (MTF)・連長圧縮 (RLE)・エントロピー符号と組み合わせて、データを圧縮する。 実装はbzip2等。.

新しい!!: Bzip2とブロックソート · 続きを見る »

プログラム (コンピュータ)

ンピュータプログラム(英:computer programs)とは、コンピュータに対する命令(処理)を記述したものである。コンピュータが機能を実現するためには、CPUで実行するプログラムの命令が必要である。 コンピュータが、高度な処理を人間の手によらず遂行できているように見える場合でも、コンピュータは設計者の意図であるプログラムに従い、忠実に処理を行っている。実際には、外部からの割り込み、ノイズなどにより、設計者の意図しない動作をすることがある。また設計者が、外部からの割り込みの種類を網羅的に確認していない場合もある。.

新しい!!: Bzip2とプログラム (コンピュータ) · 続きを見る »

データ圧縮

データ圧縮(データあっしゅく)とは、あるデータをそのデータの実質的な性質(専門用語では「情報量」)を保ったまま、データ量を減らした別のデータに変換すること。高効率符号化ともいう-->。アナログ技術を用いた通信技術においては通信路の帯域幅を削減する効果を得るための圧縮ということで帯域圧縮ともいわれた。デジタル技術では、情報を元の表現よりも少ないビット数で符号化することを意味する。 データ圧縮には大きく分けて可逆圧縮と非可逆圧縮がある。というより正確には非可逆圧縮はデータ圧縮ではない。可逆圧縮は統計的冗長性を特定・除去することでビット数を削減する。可逆圧縮では情報が失われない。非可逆圧縮は不必要な情報を特定・除去することでビット数を削減する。しかしここで「不必要な」とは、例えばMP3オーディオの場合「ヒトの聴覚では通常は識別できない」という意味であり、冒頭の「情報量を保ったまま」という定義を破っている。データファイルのサイズを小さくする処理は一般にデータ圧縮と呼ばれるが、データを記録または転送する前に符号化するという意味では情報源符号化である。 圧縮は、データ転送におけるトラフィックやデータ蓄積に必要な記憶容量の削減といった面で有効である。しかし圧縮されたデータは、利用する前に伸長(解凍)するという追加の処理を必要とする。つまりデータ圧縮は、空間計算量を時間計算量に変換することに他ならない。例えば映像の圧縮においては、それをスムースに再生するために高速に伸長(解凍)する高価なハードウェアが必要となるかもしれないが、圧縮しなければ大容量の記憶装置を必要とするかもしれない。データ圧縮方式の設計には様々な要因のトレードオフがからんでおり、圧縮率をどうするか、(非可逆圧縮の場合)歪みをどの程度許容するか、データの圧縮伸長に必要とされる計算リソースの量などを考慮する。 新たな代替技法として、圧縮センシングの原理を使ったリソース効率のよい技法が登場している。圧縮センシング技法は注意深くサンプリングすることでデータ圧縮の必要性を避けることができる。.

新しい!!: Bzip2とデータ圧縮 · 続きを見る »

ファイルフォーマット

ファイルフォーマットはコンピュータなどの情報機器で利用するファイルの保存形式である。コンピュータで扱う文書、音声、画像、動画などのさまざまなメディアのファイルを特定の利用方法やアプリケーションソフトウェアで共通に扱うための形式や規格のこと。.

新しい!!: Bzip2とファイルフォーマット · 続きを見る »

アルゴリズム

フローチャートはアルゴリズムの視覚的表現としてよく使われる。これはランプがつかない時のフローチャート。 アルゴリズム(algorithm )とは、数学、コンピューティング、言語学、あるいは関連する分野において、問題を解くための手順を定式化した形で表現したものを言う。算法と訳されることもある。 「問題」はその「解」を持っているが、アルゴリズムは正しくその解を得るための具体的手順および根拠を与える。さらに多くの場合において効率性が重要となる。 コンピュータにアルゴリズムをソフトウェア的に実装するものがコンピュータプログラムである。人間より速く大量に計算ができるのがコンピュータの強みであるが、その計算が正しく効率的であるためには、正しく効率的なアルゴリズムに基づいたものでなければならない。.

新しい!!: Bzip2とアルゴリズム · 続きを見る »

アーカイブ (コンピュータ)

アーカイブ(archive)とはコンピュータにおいてデータを長期間保存するめにデータとメタデータを関連づけて一体で保存することを指す。一つ以上のファイルとメタデータを一体にしたファイルをアーカイブファイルと呼ぶ。.

新しい!!: Bzip2とアーカイブ (コンピュータ) · 続きを見る »

算術符号

算術符号(さんじゅつふごう、)とは、1960年頃にマサチューセッツ工科大学のP.

新しい!!: Bzip2と算術符号 · 続きを見る »

特許

特許(とっきょ、Patent)とは、法令の定める手続により、国が発明者またはその承継人に対し、特許権を付与する行政行為である国家(または君主)が法人または個人に対して特権を付与する特許状(charter)とは意味が異なる。特許と特許状の意味の違いに注意。吉藤幸朔著、熊谷健一補訂『特許法概説第13版』。.

新しい!!: Bzip2と特許 · 続きを見る »

Gzip

gzip(ジー・ジップ)は、データ圧縮プログラムのひとつ、およびその圧縮データのフォーマットである。「GNU zip」の略でありGNUプロジェクトによって開発・メンテナンスされている。ほぼ全てのUNIXに標準搭載されていたcompressはLZWを使用しているため特許侵害の危険があるので、安全・安心な代替としてGNUプロジェクトが初期に開発にとりかかったもののひとつである(当時のGNU bullitinではyabbaが紹介されていたがそれを差し置いてリリースされたのがgzipである)。 フォーマットは「GZIP File Format Specification」として文書化されている。Windows(及び以前のMS-DOS)文化圏で一般的なZIPとは圧縮方法としてDeflate法が共通である以外は無関係である。.

新しい!!: Bzip2とGzip · 続きを見る »

Linuxカーネル

Linuxカーネルは、Unix系オペレーティングシステムであるLinuxのカーネル。リーナス・トーバルズによって開発が開始された。 ライセンスにGPL(バージョン2)を採用する自由なソフトウェアである。 通常、Linuxカーネルと言えばリーナスが公開している公式版のカーネルを指すが、Linuxディストリビューションで使用されているカーネルは、公式版カーネルにベンダーが独自の修正や変更を加えたものであることが多い。Androidで使用されているカーネルもそのひとつである。このような非公式のカーネルは、ベンダーがサポートすべきものとして、Linux Kernel Mailing List などでは基本的に対象外となっている。 開発の初期には、MINIXを参考としており、影響を受けてもいるが、MINIXのコードは使用せず、ゼロから書かれた(IBM PCを端末エミュレータとして動かすためのコードから成長させたものと言われている)。 GPLを採用したことがLinuxを共有の物として開発することを推進させた、とされている。また、Linuxの開発とインターネットの発展が時期的に一致したことも、Linuxの開発コミュニティ形成に寄与した。 また、開発に際して、よりオープンな開発体制をとり、現在バザール方式と呼ばれている、誰でもLinux Kernel Mailing Listへのバグ報告や修正、機能拡張パッチを公開でき、その中から最終的にリーナスと彼が任命したメインテナーがコーディネータとなって、公式版のLinuxカーネルの質を保っている。.

新しい!!: Bzip2とLinuxカーネル · 続きを見る »

Move To Front

Move to Front(先頭移動法、MTF)とは、再帰時間符号化法の一種で、再帰順位符号化(receny rank)法や book stack とも呼ばれる符号。実装に配列やリストを使用して、要素を先頭に移動する操作をメインとすることからこの呼称で呼ばれることが多い。 ブロックソートを行ったデータをMTF処理すると圧縮しやすいデータになることから、主にブロックソートを用いる圧縮プロセスの一部として利用されている。 動作原理は単純ながら、非定常であるため、その理論的性能の解析は困難であった。2005年に、1次マルコフ情報源の特定の状況においてのみ、エントロピーレートを達成することが明らかになっている。.

新しい!!: Bzip2とMove To Front · 続きを見る »

StuffIt

StuffIt(スタッフイット)は、Classic Mac OSおよびmacOSで一般的な、非常に高い圧縮率を誇るデータ圧縮およびアーカイブフォーマット。Classic Mac OSでは、ドラッグ&ドロップだけで圧縮および伸長が出来るという便利さから一躍脚光を浴びた。Windows、Linux、Solarisにも対応しているが、あまり普及していない。 最近では、より圧縮率が高くなった「StuffIt X」と呼ばれるフォーマットが使われるようになった。また、StuffItフォーマットで圧縮したデータを伸長するのにソフトウェアを必要としない自己解凍アーカイブ(Self Extract Archive)が作成できるほか、アーカイブには暗号化を施したり、冗長性を持たせたり(StuffIt Xのみ)、伸長時に、ファイルの利用者にメッセージをメールで送らせる「解凍確認」という情報を付加したりできる。 圧縮アルゴリズムとしては.

新しい!!: Bzip2とStuffIt · 続きを見る »

Xz (ファイルフォーマット)

xz は、データ圧縮プログラムのひとつ、およびその圧縮データのフォーマットである。LZMA/LZMA2圧縮アルゴリズムを利用している。xzの登場以前より使われていたgzip, bzip2と比較すると、圧縮時にはより多くの時間とメモリを消費するが、圧縮率では概ね優位で、また伸張速度もgzipより多少遅いがbzip2よりは速い傾向にある。このことから、特にアーカイブ配布用途として、tarとgzipを組み合わせて作成する場合やtarとbzip2 を組み合わせる場合と並んで採用され、bzip2を置き換えるケースも増えている。xz自身にアーカイブ機能はないのでアーカイブする場合はtarと組み合わせて使用するのが一般的である。.

新しい!!: Bzip2とXz (ファイルフォーマット) · 続きを見る »

ZIP (ファイルフォーマット)

ZIP(ジップ)は、データ圧縮やアーカイブのフォーマット。Windowsでよく使用されるフォーマットである。.

新しい!!: Bzip2とZIP (ファイルフォーマット) · 続きを見る »

拡張子

拡張子(かくちょうし、filename extension)とは、ファイルの種類を識別するためにファイルの名前(ファイル名)の末尾につけられる文字列。ファイル名の本体と拡張子は "."(ピリオド、ドット)で区切られ、拡張子はアルファベットと数字の組み合わせで、歴史的には3文字以内が好まれたが、それ以上の場合もある。拡張子は、オペレーティングシステム (OS) においてファイルの判別のために任意につけられるもので、必ずしも必須ではない。拡張子が適切でない場合は、システムまたはアプリケーションソフトウェアの動作に影響を及ぼす場合がある。.tar.gzのように複数のピリオドで区切っているケースもあるが、最後のピリオド以降を拡張子と判断するシステムが一般的である。 Mac OSでは、OSレベルでは各ファイルに埋め込まれたクリエータとファイルタイプで識別するシステムを持っている。macOSでは拡張子も利用して動作するようになり、Mac OS X v10.4 TigerからはUniform Type Identifier (UTI) なる枠組みでデータの種類を判別するようになった。 Unix系OSではファイル名の終端でファイルの種類を表す慣習があり、一般にはsuffixと呼ぶが、必ずしもピリオドで区切るとは限らない。カンマで区切る「,v」や、特に区切り文字使わずに「-」や「~」や「rc」を付けるケースもある。これはあくまでも整理上の便宜であってシステム上意味はない。ただしmakeコマンドがsuffixに基づいたルールに従って動作したり、lsコマンドが色分けして表示するようなケースはある。またデスクトップ環境であるKDE、GNOME、CDE等も拡張子に基づく動作をする。 OS以外では、MIMEタイプの設定に拡張子を利用していることなどがあげられる。Apache HTTP Serverはindex.ja.htmlとindex.html.jaの両方を「日本語(ja)のhtmlファイル」と判断する。最後尾でなくても拡張子として判断する一例である。 こうしたことから、かつては一部のシステムのみの概念だった拡張子は、現在は広い範囲で使われていることがわかる。.

新しい!!: Bzip2と拡張子 · 続きを見る »

7-Zip

7-Zip(セブンジップ)は、Microsoft Windowsを主な対応OSとするオープンソースのファイルアーカイバである。.

新しい!!: Bzip2と7-Zip · 続きを見る »

ここにリダイレクトされます:

.bz2BZIP2Bz2

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »